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Python 是 一 种 面向 对 象 、 解 释 型 的 程序 设计 语言 ， 它 已 经 被 成 功 应 用 于 科学 计算 、 数 据 分 析 以 

及 游戏 开发 等 诸多 领域 。 
本 书 深入 介绍 Python 语言 的 面向 对 象 特性 ， 全 书 分 3 个 部 分 共 18 章 。 第 1 部 分 讲述 用 特殊 方 
法 实现 Python 风格 的 类 ， 分 别 介绍 了 __init_0 方 法、 与 Python 无 颖 集成 一 一 基本 特殊 方法 、 属 性 
访问 和 特性 及 修饰 符 、 抽 象 基 类 设计 的 一 致 性 、 可 调用 对 象 和 上 下 文 的 使 用 、 创 建 容 器 和 集合 、 创 
建 数值 类 型 、 装 饰 器 和 mixin 一 一 横 切 方面 ; 第 2 部 分 讲述 持久 化 和 序列 化 ， 分 别 介绍 了 序列 化 和 
保存 、 用 Shelve 保存 和 获取 对 象 、 用 SQLite 保存 和 获取 对 象 、 传 输 和 共享 对 象 、 配 置 文件 和 持久 
化 ; 第 3 部 分 讲述 测试 、 调 试 、 部 署 和 维护 ， 分 别 介绍 了 Logging 和 Warning 模块 、 可 测试 性 的 设 
计 、 使 用 命令 行 、 模 块 和 包 的 设计 、 质 量 和 文档 。 
本 书 深 入 剖析 Python , 帮助 读者 全 面 掌握 Python 并 构建 出 更 好 的 应 用 程序 , 非常 适合 对 Python 
言 有 一 定 了 解 并 想 要 深入 学 习 Python 的 读者 ， 也 适合 有 一 定 开发 经 验 并 且 想 要 尝试 使 用 Python 
语言 进行 编程 的 IT 从 业 人 员 。 
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本 书 主要 介绍 Python 


语言 
口 听 


的 高 级 














编写 高 性 能 
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案 提 供 了 最 




















佳 性 能 。 而 对 于 一 些 正 在 寻 














简单 或 者 更 
开销 换取 最 

Python 
现 有 的 特性 

















我 们 经 


加 适合 于 特定 领域 的 问题 。 


际 人 
有 良好 可 维护 性 的 程序 。 
找 
本 书 的 大 部 分 内 容 将 介绍 一 种 给 定 设 i 
最 





解决 方案 的 
十 的 不 同 


重要 的 是 ， 























E， 特 别 是 如 何 编写 高 质量 的 Python 程序 。 这 通常 意味 
同时 ， 我 们 也 会 探究 不同 的 设计 方案 并 确定 究竟 是 哪 种 方 


千代 方案 。 


se 人- 












































问题 ， 这 也 是 一 种 很 好 的 方式 。 
一 些 方案 性 能 更 好 ， 男 一 些 方案 更 加 
找到 最 好 的 算法 和 最 优 的 数据 结构 ， 以 最 少 的 



































大 的 价值 。 














时 间 就 是 金钱 ， 高 效 的 程序 会 为 它们 的 














] 户 创造 更 多 的 价值 。 











的 很 多 内 部 特性 都 可 以 直接 被 应 用 程 

















非常 好 地 整合 。 充 分 利 / 


本 
TY 














这 些 Python 4 





字 所 使 用 。 这 意味 着 ,我们 的 程 
竺 性 ， 可 以 让 我 们 
会 为 一 个 问题 寻找 多 种 不 同 的 解决 方案 。 当 你 评估 不 同 的 算法 和 数据 结构 时 ， 通 











序 可 以 与 Python 
向 对 象 设计 整合 得 很 好 。 








的 本 

















NL 
常会 

















设计 几 种 不 同 的 方案 ， 它 们 在 性 能 和 内 存 的 使 用 上 不 
， 这 是 一 种 重要 的 面向 对 象 设计 技巧 。 





化 应 用 程序 


本 书 一 个 更 为 重要 的 主题 是 ， 





























不 同 的 方 
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， 而 这 些 方案 也 各 有 优 劣 。 








关于 编程 风格 的 主题 非常 有 趣 。 敏 锐 的 读者 会 注 











择 和 符号 的 


随 着 你 能 











使 | 








多 越 来 越 熟练 地 以 重 






































Python 源码 。 








尔 会 发 现 ， 





致 的 例子 ， 
的 缺乏 ， 正 





对 于 任何 问题 ， 


向 对 象 的 方式 使 
至 在 Python 标准 库 的 模块 











没 























尽 相 同 。 通 过 评估 不 同 的 方案 ， 最 终 合 理 地 

















所谓 的 唯一 且 最 好 的 方法 。 相 反 ， 会 有 许 









































和 一 些 非常 细微 的 部 分 ， 例 如 在 名 称 


意 到 ， 1 











] 上， 并 非 所 有 的 例子 都 完全 符合 PEP-8。 





























] Python, 也 将 不 得 不 花 大 量 的 时 间 去 阅读 各 种 

















， 都 有 很 大 的 可 变性 。 相 比 于 展示 完全 











我 们 更 倾向 于 去 关注 








是 对 代码 更 好 的 认可 。 


本 书 涵盖 的 内 容 


我 们 会 用 一 些 章节 深入 i 














解 Python 


那些 不 一 致 的 部 分 ， 正 如 我 们 在 


的 3 个 高 级 了 

















种 开源 项 目 中 所 看 到 的 ， 一 致 性 


























FE 题 。 








些 预备 知识 ， 主 要 讲解 一 些 基 本 的 主题 ， 











例如 unittest、doctest、docstrings 


第 1 部 分 “| 
地 将 Python 内 置 


后 写 入 文件 


以 及 一 
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些 特殊 的 函数 名 。 
特殊 方法 实现 Python 风格 的 类 ” 这 个 部 分 着 











的 特 ; 


第 1 章 “ 














__init 0 方法 ”， 
此 一 些 简单 的 对 象 。 接 着 ， 
2 章 “ 与 Python 无 颖 集成 

















eo 























[3 
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第 3 章 “ 属 性 访问 、 特 
要 决定 在 什么 时 候 在 什么 地 方 重 写 
解 Python 的 内 
第 4 章 “ 抽 象 基 
们 会 探讨 collections 和 
地 ， 我 们 还 会 探讨 numbers 的 基本 概念 











AAA 











5 草 “ 可 调 


ae 
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的 方式 来 














创建 
个 有 状态 的 可 i 























F 文 管 








部 工作 机 制 。 
类 设计 的 一 至 性 
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讲解 面向 对 象 编程 以 及 如 何 更 好 

















和 我 们 的 类 进行 集成 ， 这 个 部 分 包括 以 下 8 章 。 
详细 讲解 了 _ 
尝试 初始 化 更 加 复杂 的 对 
基本 特殊 方法 ” 


我 们 会 


() 的 功能 和 实现 ， 我 们 会 用 不 同 的 方式 初 
象 ， 例 如 集合 和 容器 。 


过 加 入 特殊 函数 来 扩展 一 个 





的 9 用 本 唤醒 




















， 讲 解 如 何 通 

















我 们 需要 了 解 继 承 的 默认 行为 ， 以 便 
用 重 写 。 
性 和 修饰 符 ” 








L 9 





主要 关注 collections .abc 模块 
containers 的 基本 概念 ， 主 要 关注 


今 - 














理解 怎样 的 重 写 是 必需 的 ， 以 及 什么 时 候 




















解 了 默认 情况 下 它们 是 如 何 工作 的 。 我 们 需 





主要 i 























默认 行为 。 我 们 还 将 探讨 描述 符 的 细节 ， 以 便 更 好 地 理 



































那些 党 被 所 
于 此 党 被 实现 的 部 分 。 
































9 主要 关注 




















调 


] 对 象 和 上 下 文 的 使 























]”， 主要 计 i 
我 们 会 讲解 可 调 























述 的 方法 以 不 同 


计 以 及 为 什么 有 时 候 


使 用 context1lib 提供 
象 的 一 系列 不 同 设 
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信人 














用 对 象 会 比 





的 函数 更 加 有 用 。 





己 的 上 下 文 管理 器 





在 我 们 定制 














半生 





之 前 ,我 
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各 0 





站 还 会 探讨 如 外 
章 “ 创 建 容器 和 集合 ” 

















会 调用 的 各 种 特殊 函数 。 同 
内 置 容 器 ， 然 后 通过 委托 方法 让 基础 容器 可 以 使 用 i 
涵盖 了 这 些 基本 的 运算 符 ; +、 一 、 


们 将 封装 


第 7 章 [4 


人 











创建 数值 类 型 ”， 
] 也 会 介绍 比较 运算 符 ， 包 括 <、>、<=、 
FE 意 的 设计 要 点 。 


定制 自己 的 数值 类 型 时 需要 沪 
第 8 章 “ 装 饰 器 和 mixin 一 一 横 切 方面 ” 涵盖 了 简 


类 修饰 符 和 方法 修饰 符 。 
有 2 部 分 “持久 化 和 序列 化 ”介绍 





系统 的 , 也 太 


包括 以 下 5 章 。 


第 9 章 






































第 10 章 “| 





AAA 


第 11 章 “ 用 














各 已 上 也 
能 是 通过 
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使 月 








“序列 化 和 保存 一 一 JSON、 








式 做 简单 的 持久 化 时 可 使 
用 Shelve 保存 和 羽 


例如 Shelve 和 dbm。 


SQLite 保存 和 有 








时 ， 


关注 











一 个 序列 化 到 存储 介 
ORM 存储 到 数据 库 的 。 这 个 部 分 会 











中 力 








SQL 的 特性 3 


不 符合 





























A 取 对 








获取 对 象 ”， 
面向 对 象 设 计 的 原则 ， 我 们 会 遇 到 “阻抗 不 匹配 ”问题 。 一 个 通 


有 Python 中 内 置 的 上 下 文 管 理 器 。 
container 类 的 基本 
我 们 也 会 探讨 如 何 扩展 内 置 容器 以 添加 3 





YAML、 Pickle、 
的 现 有 的 库 ， 例 如 JSON、 















































使 用 。 我 们 会 探讨 在 创建 容器 过 程 中 


新 特性 。 最 后 ， 我 
























































这 些 封装 。 
#、/ 人 、W、 儿 和 兰 。 
会 总 结 


=。 最 后 ， 我 们 会 








同时 ， 我 
一 些 在 扩展 和 





== 和 


之 三 久 























侈 饰 符 、 








的 持久 化 对 象 , 它 可 能 是 转换 为 JSON 
着 重 探讨 持久 化 的 不 同方 法 ， 


质 

















CSV 和 XML”， 涵盖 了 对 不 同 数据 格 
YAML、Pickle、XML 和 CSV。 
Python 模块 进行 简单 的 数据 库 操作 ， 























探讨 了 使 用 

















进入 更 加 复杂 的 SQL 和 关系 数据 库 的 世界 。 因 为 
的 






































解决 方案 是 使 用 ORM 存储 大 量 的 领域 对 象 。 


























传输 的 对 象 。 





第 12 章 “ 传 输 和 共享 对 象 ” 探讨 HTTP 协议 以 及 使 用 JSON、YAML 和 XML 来 表示 要 




































































第 13 章 “ 配 置 文件 和 持久 化 ” 涵盖 了 Python 应 用 程序 使 用 配置 文件 的 不 同方 法 。 




















第 3 部 分 “测试 、 调 试 、 部 署 和 维护 ”， 我们 会 展示 如 何 收集 数据 来 支持 和 调试 高 性 能 程序 。 





其 中 包括 创建 尽 可 能 完善 的 文档 











减少 技术 支持 的 难度 。 








这 个 部 分 包括 最 后 5 章 。 





第 14 章 “Logging 和 Warning 模块 >” 探讨 了 如 何 使 





型 























和 doctest。 

















] logging 和 warning 模块 来 记录 
计 和 调试 信息 。 相 比 于 使 用 print () 函数 ， 这 将 是 巨大 的 进步 。 
第 15 章 “ 可 测试 性 的 设计 ” 涵盖 了 如 何 设计 可 测试 的 程序 ， 以 及 如 何 使 用 unittest 






































第 16 章 “ 使 用 命令 行 ”探讨 如 何 使 用 argparse 模块 解析 选项 和 参数 。 接 着 ， 我 们 会 













































































是 可 靠 的 ， 并 且 是 以 正确 的 方式 实现 的 。 





阅读 本 书 你 需要 准备 什么 


你 需要 下 面 的 软件 来 编译 和 运行 本 书 中 的 示例 。 











使 用 命令 模式 来 编写 易于 整合 和 扩展 的 程序 模块 ， 而 不 是 使 用 纪 
第 17 章 “ 模 块 和 包 的 设计 ”， 涵 盖 了 如 何 设 计 模 块 和 包 。 这 是 一 个 更 高 级 的 主题 ， 我 们 会 
探讨 如 何 将 相关 的 类 组 织 在 一 个 模块 中 ， 以 及 如 何 将 相关 的 模块 组 合成 一 个 包 。 

第 18 草 “ 质 量 和 文档 ” 涵盖 了 我 们 应 该 如 何 将 设计 文档 化 ， 以 便 让 用 户 相 信 我 们 的 软件 











粹 的 shell 脚本 。 





eet 
































安装 带 有 标准 库 的 Python 3.2 或 者 更 高 版 本 。 我 们 会 使 
3.3 之 间 的 差别 很 小 。 

















Python 3.3 , 但 是 Python 3.2 和 Python 


我 们 还 会 使 用 一 些 第 三 方 的 包 ， 包 括 PyYaml、SQLAlchemy 和 Jinja2。 





O http://pyyaml.org。 


O 〇 ”http:/www.sqlalchemy.org 。 安装 的 时 候 ， 对 照 安 装 指 南 ， http://docs.sqlalchemy. 





org/en/rel_0_9/intro.html#installation。 用 --without-cextensions 可 以 简化 安装 过 程 。 


O http://jinja.pocoo.org/。 
根据 需要 ， 你 也 可 以 选择 安装 Sphinx 或 者 Docutils， 
O http://sphinx-doc.org。 


O http://docutils.sourceforge.net。 


本 书 的 目标 读者 


本 和 





























寻 为 我 们 也 会 介绍 它们 。 








主要 讲述 Python 的 高 级 主题 , 所 以 要 求 读者 熟悉 Python 3。 通 过 解决 大 型 的 复杂 问题 ,你 


A 


前 


小 


霹 








将 会 获 益 良 多 。 
如 果 你 非常 熟悉 其 他 的 编程 语言 ,但 是 想 切 换 到 Python, 那么 你 可 能 会 发 现 本 书 对 你 很 有 帮助 。 
本 书 不 会 介绍 诸如 语法 之 类 的 基本 概念 。 
对 于 熟悉 Python 2 的 程序 员 ， 本 书 可 以 帮助 你 切换 到 Python 3。 我 们 不 会 涉及 任何 版 本 切换 的 


































































































工具 《例如 ， 从 版 本 2 升级 到 版 本 3)， 以 及 任何 共用 的 库 《〈 例 如 six)。 书 中 重点 讲述 Python 3 带 来 
的 新 开发 方式 。 
约定 

















在 本 书 中 ,你 会 发 现 我 们 使 用 不 同样 式 的 文字 来 区 分 不 同类 别 的 信息 ， 下 面 是 这 些 样式 的 一 些 例子 。 
文本 中 涉及 源码 的 单词 会 用 以 下 这 种 样式 :“ 我 们 可 以 通过 import 来 使 用 Python 的 其 他 模块 ”。 
代码 块 的 样式 如 下 所 示 : 


Class Friend(Contact): 







































































def _ init (self, name, email, phone): 
self.name = name 
self.email = email 





self.phone = phone 


当 我 们 想 提 醒 你 注意 一 个 代码 块 的 特定 部 分 时 ， 我 们 对 该 部 分 使 用 粗 体 : 


Class Friend(Contact): 


| 














def init (self, name, email, phone): 
self.name = name 
self.email = email 
self.phone = phone 


以 下 是 一 个 从 命令 行进 行 输入 和 输出 的 例子 : 


>>> e = EmailableContact("John Smith", "jsmith@example.net") 
>>>Contact.all contacts 


新 术语 和 重要 的 文字 以 粗 体 显示 。 在 屏幕 上 看 到 的 字 ， 例 如 在 妆 单 或 对 话 框 中 出 现 的 文 
字 显 示 效 果 为 : “我们 通过 这 个 功能 来 实现 在 每 次 单 击 Roll 按钮 时 , 在 标签 中 显示 一 个 新 的 随 
机 值 ”。 

















































































































Rs 警告 或 重要 信息 会 以 这 样 的 形式 显示 。 


Da) | 


< 
| 总 提示 和 技巧 会 以 这 样 的 形式 显示 








非常 欢迎 读者 对 本 书 提 供 反馈 和 建议 。 证 我 们 知道 你 关于 本 书 的 看 法 一 一 你 所 喜欢 和 不 喜欢 的 

















部 分 。 哪 部 分 内 容 使 读者 获得 了 最 大 收获 ， 了 解 这 点 对 于 我 们 是 重要 的 。 
如 果 你 要 为 我 们 提供 反馈 的 话 ， 只 需要 发 送 邮件 到 feedback@packpub.com, 并 在 消息 标题 中 包 


含 书 名 






























































客服 支持 


如 果 你 有 推荐 让 我 们 出 版 的 书 ， 请 发 送 邮件 至 suggest@packtpub.com。 
如 果 有 一 个 你 所 擅长 的 主题 并 有 兴趣 写 书 ， 可 以 联系 www.packtpub.com/authors。 























作为 Packt 图 书 的 主人 ， 我 们 会 尽力 为 你 提供 帮助 。 
下 载 本 书 的 示例 代码 


你 可 以 从 此 处 下 载 所 有 你 通过 Packt 账号 支付 的 Packt 图 书 的 示例 代码 : http://www.PacktPub.com。 










































































如 果 你 是 通过 其 他 方式 支付 的 , 可 以 访问 http:Wwww.PacktPub.com/support 并 进行 注册 , 我 们 将 通过 
邮件 的 方式 发 送 给 你 。 




















勘误 


我 们 已 经 尽力 保证 本 书 内 容 的 质量 并 避免 错误 的 发 生 。 如 果 你 发 现 了 本 书 的 任何 错误 

















可 能 


























是 在 文字 描述 上 或 代码 ! 我 们 将 非常 感谢 你 能 联系 我 们 。 这 样 做 可 以 为 其 他 读者 提供 帮助 并 有 助 于 






















































































我 们 提高 本 书后 续 的 内 容 质量 。 如 果 你 发 现 了 任何 勘误 ， 请 通过 访问 http://www.packtpub.com/support 

















来 联系 我 们 ， 选 择 你 的 书 并 单 击 let us know 链接 ， 然 后 勘误 会 被 上 传 到 我 们 的 网 站 ， 或 是 添加 到 该 






































书 名 下 的 勘误 列 
行 查看 。 


版 权 


对 各 种 媒体 





























表 。 任何 已 有 的 勘误 都 可 以 通过 在 http:/www.packtpub.com/support 选择 书 名 来 进 

















而 言 ， 互 联网 上 受 版 权 保护 的 各 种 材料 都 长 期 面临 非法 复制 的 问题 。Packt 非常 重 



































视 对 版 权 和 许可 的 保护 。 如 果 你 在 网 络 上 发 现 了 任何 对 我 们 的 内 容 进行 非法 复制 的 情形 ， 请 立即 为 











我 们 提供 网 址 或 网 站 名 称 ， 这 样 我 们 可 以 采取 相应 措施 。 
你 也 可 以 通过 copyright@packtpub.com 联系 我 们 ， 提 供 盗版 材料 的 链接 。 








我 们 感谢 你 























能 协助 保护 作者 版 权 并 帮助 我 们 为 你 提供 更 有 价值 的 内 容 。 




















6 前言 


如 


其 他 问题 


如 果 你 对 本 书 任何 一 方面 存在 疑问 ， 可 以 通过 questions@packtpub.com 和 我 们 联系 ， 我 们 会 尽 
力 提供 答复 。 








Mike Driscoll 从 2006 重 
技巧 (博客 地 址 : http://www.blog.pythonlibrary.org/)。 他 也 是 DZone 出 版 的 Core Python refcard 
书 的 作者 之 一 























审阅 者 简介 














， 同 时 也 在 


开始 使 

















己 的 博客 中 分 享有 关 Python 的 














Python 语言 ， 他 很 喜欢 在 自 














Packt 出 版 社 出 版 过 多 本 个 人 著作 ， 例 如 Python 3 Object Oriented 


Programming、 Python 2.6 Graphics Cookbook 和 Tkinter GUT Application Development Hotshot。 Mike 


最 近 在 写 Python 107 这 本 书 。 











我 要 感谢 我 的 妻子 Evangeline 对 我 长 期 以 来 的 支持 , 感谢 我 的 朋友 和 家 庭 成 员 为 我 所 做 的 一 切 。 


R6man Joost 从 1997 年 就 开始 从 事 开 源 项 目的 开发 。 作 为 GIMP 用 户 文档 
为 GIMP 和 Python/Zope 的 了 


Sakis Kasampalis 来 自 新 西 兰 ， 








已 经 





的 项 目 经 理 ， 他 






































开源 项 目 做 了 




















8 年 的 贡献 .目前 Roman 在 澳大利亚 布 里 斯 班 的 红 帽 公司 工作 。 
目前 在 基于 位 置 服务 的 B2B 提供 商 担 任 软 件 开 发 工程 师 。 他 不 赞 































































































成 对 编程 语言 和 开发 工 





























\ 持 过 度 追 捧 的 态度 。 他 的 





原则 是 把 正确 的 技术 应 用 在 适合 的 问题 上 。Python 



































是 他 最 喜爱 的 工具 之 














上 的 一 个 与 Python 设计 模式 相关 
同时 ， 他 也 是 Packt 

Albert Lukaszewski Ph.D 
有 30 多 年 的 编程 经 验 ， 现 在 是 系统 设计 与 实现 方面 
首席 工程 师 。 他 的 大 部 分 经 验 都 与 文本 处 理 、 数 据 库 系统 和 
































， 他 很 看 重 Python 的 高 效 。 在 FOSS 的 项 目 工作 


版 的 Learning Python Design Patterns 一 书 的 审阅 孝 














期 间 ，Kasampalis 维护 GitHub 


以 从 https://github.com/faif/python-patterns 下 载 。 














的 项 目 ， 相 关 资 料 可 
































顾问 。 他 已 经 


前 是 苏格兰 南部 的 Lukaszewski 咨询 服务 中 心 的 首席 
的 顾问 。 他 之 前 还 在 爱 可 信 欧 洲 有 限 公司 担任 















































Processing，NLP) 相关 。 同 
他 之 前 还 曾 为 纽约 时 报 子 公司 About.com 写 过 Python 专栏 。 


Hugo Solis 是 哥 斯 i 
影响。 他 在 使 用 
由 软件 基金 会 的 成 员 之 一 ， 也 做 过 一 些 开 源 项 目 。 





材料 特性 上 




















个 非 营 利 的 科 砂 
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-A 




















C/C++ 和 











自然 语言 处 理 (Natural Language 
时 ， 他 还 写 过 MySOLfor Python 一 书 ， 该 书 由 Packt 出 版 。 除 此 之 外 ， 








百 


















































上 大 学 物理 系 的 教授 助理 。 他 目前 主要 研究 计算 宇宙 学 、 复 杂 性 和 氧 对 
Python 进行 科研 和 可 视 化 方面 有 着 丰富 的 编程 经 验 。 他 是 
目前 他 主要 负责 管理 IFT， 这 是 哥斯达黎加 的 一 




















































































































机 构 ， 和 致力 了 





F 物 理学 科 的 实践 〈http:Wiftucrorg )。 


我 要 向 我 亲爱 的 母亲 Katty Sanchez 表示 感谢 ， 感 谢 她 的 支持 以 及 诸多 不 错 的 创意 。 


作者 简介 

















|» 
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Steven F. Lott 的 编程 生涯 开始 于 20 世纪 70 年 代 ， 那 时 候 计 算 机 体积 很 大 、 昂 贵 并 且 非 常 
见 。 作 为 软件 工程 师 和 架构 师 ， 他 参与 了 100 多 个 不 同 规模 的 项 目 研 发 。 在 使 用 Python 解决 
业务 问题 方面 ， 他 已 经 有 10 多 年 的 经 验 了 。 

Steven 目前 是 自由 职业 者 ， 居 住 在 美国 东海 岸 。 他 的 技术 博客 是 : http://slott-softwarearchitect. 
blogspot.com 。 


我 要 对 Floating Leaf 的 支持 和 引导 表示 深 深 的 感谢 。 


































































































为 了 使 本 书 接 下 来 的 内 容 更 ; 
将 重点 关注 21 点 游戏 的 模拟 
然而 ， 对 于 面向 对 象 纺 


个 情 




















>» 
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Introduction to Programming 。 




















青 晰 ， 我 们 乡 
日 并 不 赞成 赌博 。 
程 来 说 ,模拟 是 最 早 
形 。 有 关 更 多 信息 ， 可 参见 et 以 及 Rob Pooley 与 



















































































的 问题 之 一 。 















































































































































































































































一 些 预备 知识 


也 是 台 已 
也 是 能 


























E 来 看 一 些 关 心 的 问题 。 其 中 一 项 是 


21 点 游戏 。 我 们 








够 体现 出 





用 向 对 象 编程 优雅 















































的 An 







































































本 章 会 介绍 一 些 工具 的 背景 ， 它 们 是 编写 出 完整 的 Python 程序 和 包 的 基础 。 在 接 下 来 的 章 中 
会 使 用 它们 。 

我 们 会 使 用 timeit 模块 将 De 找 出 性 能 更 好 的 那个 。 在 很 多 有 关 如 何 更 好 
地 写 出 适用 于 问题 模型 代码 的 主观 考虑 中 ， 使 用 客观 事实 来 进行 说 明 是 非常 重要 的 。 

我 们 将 介绍 如 何在 面向 对 象 中 使 用 unittest 和 doctest 模块 , 它们 是 在 开发 过 程 中 核对 实 
际 工作 的 基本 工具 。 

一 个 良好 的 面向 对 象 设计 应 当 是 清晰 的 并 且 可 读 性 很 强 。 为 了 确保 良好 的 可 读 性 , 编写 Python 
风格 的 文档 是 必要 的 。Docstrings 在 模块 、 类 和 方法 中 都 很 重要 。 我 们 会 在 这 里 简单 概括 RST 标记 
并 会 在 第 18 章 “ 质 量 和 文档 ”中 详细 介绍 。 

此 外 ， 我 们 还 要 解决 集成 开发 环境 (Integrated Development Environment，IDE) 的 问题 。 常 见 
的 问题 是 Python 开发 最 好 的 IDE。 

最 后 ， 我 们 会 介绍 Python 中 特殊 基本 方法 的 概念 。 关 于 特殊 方法 ， 在 前 7 章 都 有 介绍 。 在 这 
里 ， 我 们 会 介绍 一 些 有 助 于 理解 第 1 部 分 “用 特殊 方法 实现 Python 风格 的 类 ”的 背景 知识 。 

在 讨论 Python 面向 对 象 编程 过 程 中 , 将 尽量 避免 一 些 题 外 话 。 我们 会 假设 你 已 经 读 了 Python 3 
Object Oriented Programming 这 本 书 。 我 们 不 会 重复 在 其 他 地 方 已 经 讲 得 很 清楚 的 内 容 。 在 本 书 中 ， 


Pe 


会 完全 关注 Python 3 的 内 容 。 








我 们 会 引用 很 多 常见 的 面向 对 象 设计 模式 , 也 不 会 





出 现 的 内 容 。 

















慎 

















EE 复 在 Learning Python Design Patterns 书 中 








2 一 些 预备 知识 


关于 21 点 游戏 


如 果 你 还 不 熟悉 21 点 游戏 ， 以 下 是 大 致 的 介绍 。 
游戏 的 最 终 目标 是 ， 从 庄家 手中 拿 到 牌 ， 将 手中 的 牌 组 成 和 为 在 庄家 点 总 数 与 21 之 间 的 


数字 。 








在 纸牌 
等 于 11 点 或 




















科 中 


如 果 手 : 
有 4 种 两 张 牌 的 组 合 可 以 构成 21 点 。 它 们 都 称 为 21 点， 尽管 其 











数 邱 

















(2 到 10) 包含 了 牌 的 点 数值 。 而 了 
1 点 。 当 把 A 当 作 11 点 使 用 时 ， 手 ' 
的 值 称 为 硬 手 。 





























数字 牌 〈J、Q、K) 等 同 了 
牌 的 值 被 称 为 软 手 。 当 将 A 当 作 1 点 使 








F 10 点 。 而 A 
时 ， 
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含 











玩 21 点 游戏 


21 点 游戏 在 不 同 的 场合 会 有 所 不 同 ， 但 主要 流程 类 似 ， 包 含 如 下 几 点 。 








了 A 和 7， 就 可 以 当 作 8 点 硬 手 或 


18 点 软 手 。 
























































面 彰 上。 









































首先 ， 玩 家 和 庄家 各 自发 两 张 牌 ， 玩 家 会 知道 自己 手 

















一 种 组 合 包含 了 J。 






































的 牌 面值 。 在 有 些 场合 中 会 需要 将 


庄家 的 牌 一 张 朝 上 一 张 朝 下 。 因 而 玩家 会 了 解 一 点 庄家 的 牌 ， 但 不 完全 知道 。 
13 的 概率 为 10， 因 而 构成 总 数 21。 玩 家 




















如 果 庄 家 朝 上 的 那 张 牌 是 A， 那 么 另 一 张 
可 以 选择 做 一 个 额外 
下 一 步 ， 玩 家 可 以 选 





























有 4/ 








的 保险 下 注 。 
或 停止 拿 牌 。 


























择 拿 



























































这 两 种 常见 的 选择 称 为 叫 或 停牌 。 














还 会 有 更 多 选择 。 如 果 玩 家 手中 的 牌 匹配 ， 可 以 选择 分 牌 。 这 算是 额外 的 下 注 ， 分 后 的 两 


手 牌 将 分 开 进行 游戏 。 














最 终 ， 玩 家 可 以 在 拿 最 后 一 张 牌 前 选择 双 倍 下 注 ， 称 为 天 生 21 点 。 如 果 玩 家 的 牌 总 数 为 











10 或 11， 





















































须 小 于 18 点 。 
忽略 。 


如 果 庄 家 超出 























这 就 
的 最 终 评判 如 下 。 
如 果 玩 家 的 牌 大 于 21 点 ， 称 为 超出 21， 玩 家 输 并 


如 果 玩 家 的 牌 小 于 等 于 21 点 , 那么 根据 一 种 简 
牌 的 总 数 高 出 18， 上 庄家 必须 停 叫 


是 一 种 常见 的 下 注 方式 。 











庄家 朝 下 的 那 张 


















































手 : 











21， 玩 家 赢 。 








如 果 庄 家 和 玩家 都 小 于 等 于 21 点 ， 则 比较 他 们 村 
现在 暂时 不 关心 最 终 的 收益 。 对 不 同 玩法 和 下 注 策 




















将 不 
单 的 规则 庄家 拿 牌 。 之 后 庄家 手中 的 牌 必 




















中 牌 的 大 小 。 





各 的 模拟 过 程 来 说 ， 


改 考虑 。 





。 关 于 这 点 会 略 有 不 同 ， 现 在 暂时 





总 收益 关系 不 大 。 








21 点 游戏 策略 


对 于 21 点 游戏 来 说 ， 玩 家 必须 使 用 以 1 
种 策略 用 于 决定 玩法 : 保险 、 叫 、 停 叫 、 分 牌 或 双 倍 。 
另 一 种 策略 用 于 决定 下 注 大 小 。 一 种 常见 的 诬 误 统计 可 以 引导 玩家 提高 或 降低 下 注 ， 进 而 
率 。 伯 
包 

































































鲜 
最 大 限度 地 保证 胜 的 概率 并 减少 输 的 概 
行 模拟 。 它 们 是 一 些 有 趣 的 算法 ， 通 常 
来 完成 。 











这 两 种 策略 是 介绍 策略 模式 不 错 的 例子 。 


21 点 游戏 模拟 器 对 象 的 设计 














一 些 预备 知识 3 


下 两 种 策略 。 


























E 何 模拟 游戏 的 软件 也 必须 对 复杂 下 注 策略 进 











含 状态 ， 需 要 学 习 一 些 高 级 的 Python 编程 技巧 














我 们 将 使 用 游戏 中 的 元 素 ， 例 如 玩家 手中 的 
。 我 们 会 重点 关注 游戏 中 的 元 素 ， 因 为 它们 
个 简单 的 容器 : 存放 手中 的 牌 对象 ， 可 以 包含 0 个 或 多 个 。 
Card 的 子 类 : NumberCard，EaceCard 和 Ace。 


进行 模拟 
使 用 


介绍 


介绍 几 种 不 同 的 方式 来 定义 这 种 简单 的 类 层次 结 


对 几 种 不 


介绍 


从 全 局 的 视角 来 看 玩家 对 象 ， 玩 家 会 有 几 和 手 





的 组 合 对 











捍 作 













































































为 对 象 模型 的 例子 。 然 而 ， 不 会 对 整个 过 程 
会 有 细微 的 差别 但 不 是 特别 复杂 。 





















































同 的 实现 方式 进行 尝试 。 



































构 。 由 于 层次 结构 很 小 〈 并 且 简 单 )， 可 以 简单 



































几 种 实现 玩家 手中 牌 的 方式 。 这 只 是 一 个 简单 的 纸牌 集合 ， 包 含 了 一 些 额外 的 功能 。 



































象 。 





























我 们 也 会 对 洗 牌 和 发 牌 进行 快速 介绍 。 









































和 下 注 策略 以 及 21 点 游戏 策略 。 这 是 一 个 复杂 



























































F 均 时 间 值 , 来 自 其 他 计算 机 上 OS 级 别 活动 











性 能 timeit 模块 

我 们 会 使 用 timeit 模块 来 将 不 同 面向 对 象 设计 和 Python 结构 进行 对 比 ，timeit 模块 包含 
了 很 多 函数 。 重 点 关注 的 是 timeit， 这 个 函数 会 为 一 些 语句 创建 一 个 Timer 对 象 ， 也 会 包含 一 
些 预 备 环境 的 安装 代码 ， 然 后 调用 Timer 的 timeit () 方 法 来 执行 一 次 安装 过 程 并 重复 执行 目标 
语句 。 返 回 值 为 运行 语句 所 需 的 时 间 。 

默认 计数 为 100000 次 。 这 提供 了 一 个 有 意义 的 
的 统计 。 对 于 复杂 的 或 长 时 间 运 行 的 语句 ， 需 要 谨慎 使 用 小 计数 值 。 


以 下 


























是 与 timeit 简单 交互 的 示例 代码 : 











4 一 些 预 备 知识 


>>> 七 imeit .timeit ( 
. Class SomeClass: 


"obj :method () 


def method (self): 


pass 

. Obj= SomeClass () 
wr ") 
0.1980541350058047 


下 载 示 例 代码 
y 你 可 以 通过 自己 的 帐号 下 载 所 有 从 Packt 出 版 社 所 购买 的 书籍 中 
QQ 的 示例 代码 : http:/www.packtpub.com。 如 果 你 是 从 其 他 地 方 购买 
的 ， 可 以 访问 http://www.packtpub.com/support 并 注册 ， 我 们 会 通 
过 邮件 形式 发 送 给 你 。 














obj .method () 语句 以 字符 串 的 形式 提供 给 tim 
式 提 供 。 语 句 中 所 需要 的 任何 东西 都 必须 在 安装 ， 





底 











eit () ， 安 装 为 类 定义 # 
提供 ， 它 包括 所 有 的 导入 和 所 有 的 变量 定义 以 及 

































































可 能 会 需要 多 尝试 儿 次 来 完成 安 








交互 式 Python 时 ， 经 常会 由 卫 






































翻 屏 导 致 无 法 追踪 全 局 变量 和 导入 信 






































个 例子 是 ，10000 次 空 方法 的 1 

















以 下 是 另 一 个 使 用 timeit 的 例子 : 


>>> 七 imeit .timeit( " 
. def fE() : 
Pass 


mn ) 


0.13721893899491988 











这 个 例子 说 明 ， 空 函数 的 调用 会 比 空 方 法 的 调 月 





在 一 些 情况 下 ，OS 的 7 

















略 快 一 些 ， 在 这 个 例子 : 
开销 可 以 作为 性 能 的 测量 组 伯 





















































模块 中 可 以 使 用 repeat () 函数 来 蔡 代 timeit () 函数 。 























性 能 上 的 影响 做 进一步 分 析 。 





对 的 多 个 样本 ， 对 OS 在 



































对 于 我 们 而 言 ，timeit () 函数 会 提供 所 有 反馈 信息 ， 我 们 可 用 





及 的 要 素 进行 评估 。 
测试 






































和 企 客 观 上 对 不 同 面向 对 象 涉 





unittest 和 doctest 














单元 测试 当然 是 基本 的 。 如 果 没 有 月 
在 。 换 句 话 说， 对 于 一 个 功能 来 说 ， 





月 于 展示 某 个 功能 的 单元 测试 ， 玉 
直到 有 测试 可 以 说 明 它 














Bb 么 这 个 功能 就 不 是 真 
已 经 完成 才 算是 完成 。 










































































我 们 只 会 对 测试 进行 少 











对 每 个 面向 对 象 设计 功能 的 测试 都 进 

















本 书 的 厚度 应 该 是 


见 在 的 两 倍 。 在 忽略 测试 内 容 的 细节 上 会 存在 

















区 ， 好 的 单元 测试 似 导 
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可 选 的 。 当 然 不 是 ， 它 们 是 必需 的 。 





本 单元 测试 是 必需 的 
QQ 如 果 有 疑问 ， 可 以 先 设 计 测 试用 例 ， 再 对 代码 进行 修改 ， 满 足 测 
试用 例 。 





























Python 提供 了 两 种 内 置 的 测试 框架 。 大 部 分 应 用 和 库 会 同时 使 用 两 者 。 对 于 所 有 测试 来 说 ， 普 
遍 的 一 种 封装 为 unittest 模块 。 另 外 ， 在 许多 公共 API docstrings 中 可 以 找到 一 些 例子 ， 都 使 用 
了 doctest 模块 。 而 且 ， 在 unittest 中 可 以 包含 doctest 中 的 一 些 模块 。 

好 一 点 的 做 法 是 ， 每 个 类 和 函数 都 至 少 有 一 个 单元 测试 。 更 重要 的 是 ， 可 见 的 类 、 函 数 和 模块 
也 要 包含 doctest。 还 有 更 好 的 做 法 : 100% 的 代码 覆盖 ，100% 的 逻辑 分 支 履 盖 等 。 

实际 上 ， 一 些 类 不 需要 测试 。 例 如 由 nameqtuple() 创建 的 类 不 需要 单元 测试 ， 除 非 首 先 去 
怀疑 namedqtuple () 的 实现 。 如 果 不 相 信 Python 的 实现 ， 就 无 法 基于 它 来 写 程序 。 

一 般 地 ， 我 们 会 先 设计 测试 用 例 再 编写 可 以 通过 测试 用 例 的 代码 。 测 试用 例会 凸显 出 代码 ! 
API 的 形态 。 本 书 会 介绍 几 种 写 代 码 的 方式 ， 它 们 的 接口 是 相同 的 ， 这 点 很 重要 。 一 旦 我 们 定义 了 
接口 ， 会 有 几 种 不 同 的 实现 方式 。 一 组 测试 应 该 能 够 适应 几 种 不 同 面向 对 象 的 设计 。 

一 种 常见 的 方式 是 使 用 unittest 工具 为 项 目 创建 至 少 有 以 下 3 种 平行 的 目录 。 

@ myproject: 这 个 目录 会 需要 安装 在 1ib/site-packages 中 ， 作 为 应 用 最 终 的 包 。 它 

会 有 一 个 _init__ .py 包 ， 而 且 会 放 在 每 个 模块 中 。 
@ test: 这 个 目录 包含 测试 脚本 。 对 于 一 些 情形 ， 这 些 脚本 在 模块 中 是 平行 存在 的 。 在 一 些 
情况 下 ， 脚 本 可 能 会 很 大 并 且 比 模块 自身 更 复杂 。 

@ doc: 这 个 目录 中 会 包含 其 他 文档 。 我 们 会 在 下 一 节 以 及 第 18 章 “ 质 量 和 文档 ”中 对 它 

进行 介绍 。 

在 一 些 情况 下 ， 你 会 希望 在 多 个 类 上 运行 同样 的 测试 组 件 ， 这 样 就 能 够 确保 每 个 类 是 工作 的 。 
但 在 根本 不 工作 的 类 上 使 用 timeit 进行 比较 是 没有 意义 的 。 


单元 测试 与 技术 探究 


作为 面向 对 象 设计 的 一 部 分 ， 通 常会 创建 一 个 类 似 本 节 代 码 中 所 演示 的 技术 探究 模块 ， 我 们 会 
把 它 分 为 3 个 部 分 。 首 先 ， 是 以 下 这 个 全 局 的 抽象 类 。 

















































































































































































































































































































































































































































































































import types 
import unittest 


class TestAccess( unittest.TestCase ) : 
def test should add and get attripute( self ) : 
self.object.new attribute= True 
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self.assertTrue( self.object.new attribute ) 
def test should fail on missing( self ) : 
self.assertRaises( AttributeError, lambda: self.object. 
undefined ) 














抽象 类 Testcase 的 子 类 中 定义 了 一 些 希 望 类 可 以 通过 的 测试 。 实际 被 测试 的 对 象 被 忽略 了 。 
通过 self .object 被 引用 ， 但 是 没有 提供 定义 ， 使 得 Testcase 子 类 保持 抽象 。 每 个 具体 类 

都 会 需要 setUp () 方法 。 

以 下 是 3 个 具体 的 Testaccess 子 类 ， 会 包含 以 下 3 种 不 同 对 象 的 测试 。 


class SomeClass: 










































































pass 
class Test EmptyClass( TestAccess ): 
def setUp( self ) : 
self.object= SomeClass () 


Namespace( TestAccess ): 
tUp( self ): 
lf.object= types.SimpleNamespace () 
_Object( TestAccess ): 
def setUp( self ) : 
self.object= object() 





Se 



































TestAccess 类 的 每 个 子 类 都 提供 了 所 需要 的 setUp () 方法 。 每 个 方法 创建 了 一 种 不 同 的 被 
测试 对 象 。 第 1 个 是 空 类 的 实例 。 第 2 个 是 types .SimpleNamespace 的 实例 。 第 3 个 是 object 
的 实例 。 

为 了 运行 这 些 测试 ， 需 要 创建 一 个 组 件 ， 来 阻止 我 们 运行 TestAccess 抽象 类 的 测试 。 

以 下 是 探究 的 其 余部 分 。 

def suite(): 


s= unittest.TestSuite() 
s.addTests( unittest.defaultTestLoader.loadTestsFromTestCase (Test 


























EmptyClass) ) 

s.addTests( unittest.defaultTestLoader.loadTestsFromTestCase (Test 
Namespace) ) 

s.addTests( unittest.defaultTestLoader.loadTestsFromTestCase (Test 
Object) ) 

etarn. 5 
本 name == " main "; 





t= unittest.TextTestRunner () 
t.run( suite() ) 


现在 我 们 得 到 了 具体 的 证 据 ，object 类 的 使 用 方式 与 其 他 类 是 不 同 的 。 进 一 步 说 ,我 们 有 了 一 
个 可 以 用 于 演示 其 他 可 行 (或 不 可 行 ) 设计 的 测试 。 例 如 ， 用 于 演示 types. SimpleNamespace 作 
为 空 类 行为 的 测试 。 
我 们 跳 过 了 很 多 单元 测试 用 例 的 细节 ， 会 在 第 15 章 “ 可 测试 性 的 设计 ”中 进行 详细 介绍 。 
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Docstr ing 一 一 RST 标记 和 文档 工具 














所 有 的 Python 代码 都 应 该 在 模块 .类 和 方法 级 别 包含 docstrings。 不 是 每 个 方法 都 需要 docstring， 
些 方法 名 已 经 很 好 了 ， 不 需要 进一步 说 明 。 而 大 多 数 情况 下 ， 文 档 的 说 明 是 基本 的 。 
Python 文档 通常 使 用 ReStructured Text (RST) 标记 来 写 。 
然而 ， 在 本 书 的 示例 代码 中 ， 为 了 限制 本 书 内 容 在 合理 的 范围 内 ， 没 有 使 
的 缺点 是 ，docstrings 看 起 来 是 可 选 的 ， 可 它们 是 必需 的 。 
再 次 强调 ，docstrings 是 必需 的 。 
docstrings 在 Python 中 通过 以 下 3 种 方式 使 用 。 
@ 内 部 的 help() 函数 用 于 显示 docstrings。 
@ doctest 工具 可 以 在 docstrings 中 查找 示例 并 把 它们 当 作 测试 用 例 运 行 。 
@ 类似 Sphinx 和 epydoc 这 样 的 外 部 工具 可 以 帮助 文档 的 提取 。 


于 RST 相对 简单 ， 编 写 好 的 docstrings 相对 非常 简单 。 我 们 会 在 第 18 章 “ 质 量 和 文档 ”中 
对 文档 以 及 预计 标记 进行 详细 介绍 。 现 在 通过 一 个 例子 来 看 一 下 docstring 的 形式 。 


def factorial( n ): 






















































































] docstrings。 这样 


i 












































过 




































































































































































"""Compute n! recursively. 


:Daram n: an integer >= 0 
:returns: nl! 


Because of Python's stack limitation, this won't 
compute a value larger than about 1000!. 


>>> factorial (5) 
120 


if n == 0: return 1 
return n*factorial (n-1) 





以 上 代码 展示 了 RST 标记 的 参数 和 返回 值 , 还 包括 了 关于 限制 的 一 段 说 明 。 所 包括 的 doctest 


输出 可 用 于 验证 使 用 doctest 工具 完成 的 实现 。 有 很 多 标记 功能 可 用 于 提供 更 多 的 结构 和 语义 方 
面 的 信息 。 


IDE 的 选择 













































































I 


关于 Python 开发 的 IDE 常见 问题 是 最 好 的 IDE 是 什么 。 简 单 的 
支持 Python 的 开发 环境 实在 太 多 了 。 
本 








答 是 IDE 的 选择 根本 不 重要 ， 














此 | 








的 所 有 实例 都 通过 Python 的 >>> 提 示 来 演示 交互 的 过 程 。 运 行 能 够 交互 的 例子 是 非常 有 意 


局 
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义 的 。 精 心 编写 的 Python 代码 应 该 很 简单 








小 
el 
CC 
3 
3 
如 
人 心 
a 
(Gil 
a 


Rs 我 们 应 该 能 够 在 >>> 提 示 中 展示 一 个 设计 ， 














从 >>> 提 示 来 运行 代码 是 对 Python 设计 复杂 度 的 一 个 重要 的 质量 测试 。 如 果 








那么 就 没有 办 法 从 >>> 提 示 运 行 。 对 于 一 些 复 杂 的 类 ， 应 该 提供 模仿 对 象 来 模拟 简单 的 交互 过 程 。 


关于 特殊 方法 名 


Python 有 多 层 的 实现 ， 但 我 们 只 关心 其 中 两 层 。 

















类 或 函数 过 于 复杂 ， 





从 表面 上 看 ， 我 们 有 Python 的 源 代码 。 源 代码 是 传统 面向 对 象 与 过 程式 函数 调用 的 混合 体 。 





























面向 对 象 符号 的 后 级 中 通常 包括 opject.method() 或 object.attribute 
包括 了 function (object) 的 调用 ， 是 典型 的 过 程式 设计 。 此 外 还 包 
object+other。 男 外 还 有 其 他 语句 ， 例 如 for 和 调用 对 象 方法 的 witn 语句 。 













































































这 样 的 结构 。 而 前 级 
含 了 插入 符 ， 例 如 























function (object) 前 级 的 出 现 会 导致 一 些 程序 员 产 生 疑 问 ， 是 否 进行 纯 面向 对 象 的 Python 
编程 。 认 为 严格 的 遵守 面向 对 象 (object .method() ) 的 设计 方式 是 有 必要 或 有 帮助 的 ， 这 种 说 
法 是 不 够 明确 的 。Python 混合 使 用 了 前 级 和 后 级 的 编程 方式 ， 前 缀 符号 代表 了 特殊 方法 的 后 缀 符号 。 
前 级 、 中 级 和 后 缀 符号 的 选择 要 基于 表达 力 和 优雅 程度 。 良 好 Python 代码 的 目标 之 一 是 ， 它 看 起 
























































来 应 该 像 英 文 。 在 底层 ， 语 法 变化 是 由 Python 特殊 方法 实现 的 。 






































在 Python 中 的 任何 事物 都 是 对 象 。 这 点 与 Java 或 C++ 不 同 ， 它 们 会 有 “原始 ”类 型 来 避免 对 





























象 范 型 。 每 个 Python 对象 都 提供 了 一 个 特殊 方法 的 数组 ， 其 中 包含 了 语言 最 上 

















例如 ， 可 以 在 应 用 程序 中 写 str (x) 。 这 个 前 级 符号 在 底层 的 实现 为 x._ str_ 














类 似 atb 这 样 的 结构 会 被 实现 为 a.” add (b) 或 bp. radd (a)， 取 决 于 对 象 a 和 ob 所属 




















的 类 定义 中 所 提供 的 类 型 兼容 性 规则 。 
需要 强调 的 是 ， 在 外 部 语法 与 特殊 方法 内 部 实现 之 间 的 映射 不 只 是 把 fu 


























层 功 能 的 实现 细节 。 
_()。 





nction (x) 重 写 为 








x. function _()。 在 许多 语言 功能 中 ， 包 含 了 一 些 特殊 方法 文 持 这 项 功能 。 一 些 特殊 方法 包含 了 











从 基 类 、object 所 继承 的 默认 实现 ， 男 一 些 特殊 方法 则 没有 默认 实现 而 会 直接 抛 出 异常 。 


























第 1 部 分 “用 特殊 方法 实现 Python 风格 的 类 ”将 会 介绍 这 些 特殊 方法 并 会 演示 如 何 实现 这 些 











特殊 方法 ， 以 使 得 我 们 的 类 定义 能 够 与 Python 无 颖 结合 。 
所 2 士 


/AN 一 吕 











我 们 介绍 了 示例 的 问题 域 : 21 点 游戏 。 选 择 这 个 例子 是 因为 它 包 含 了 一 定 的 算法 复杂 度 但 又 

















不 是 过 于 复杂 或 者 难 懂 。 另 外 也 介绍 了 在 本 书 中 会 用 到 的 3 个 重要 模块 。 
@ timeit 模块 ， 我 们 会 用 于 对 比 不 同 实现 的 性 能 。 
































一 些 预备 知识 9 











@ unittest 和 doctest 模块 ， 我 们 会 用 于 确保 软件 能 够 正确 运行 。 

书 中 也 介绍 了 几 种 向 Python 程序 中 添加 文档 的 方式 。 我 们 会 在 模块 、 类 和 函数 中 人 
docstrings。 为 了 节省 空间 ， 不 是 每 个 例子 都 会 展示 docstrings， 但 它们 都 是 最 基本 的 。 
集成 开发 环境 (Integrated Development Environment, IDE ) 的 使 用 不 是 基本 的 , 任何 有 效 的 IDE 
或 文本 编辑 器 对 于 高 级 Python 开发 都 应 该 是 可 以 选择 的 。 


在 后 续 的 8 章 中 , 我 们 将 对 特殊 方法 名 进行 分 类 介绍 , 内 容 主要 包括 如 何 能 够 创建 出 与 内 置 模块 
无 颖 集成 的 Python 程序 。 


在 第 1 章 中 ， 我 们 会 重点 关注 ”init () 方 法 以 及 使 用 它 的 不 同方 式 。 init _() 方 法 很 


对 为 初始 化 是 对 象 生命 0 每 个 对 象 必 须 正 确 地 初始 化 才能 很 好 地 工作 。 
es 参数 值 的 形式 有 很 多 种 。 我 们 会 介绍 几 种 不 同 设计 init _() 的 方式 。 
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第 1 部 分 





用 特殊 方法 实现 
Python 风格 的 类 


init _() 方 法 





与 Python 无 颖 集成 一 一 基本 特殊 方法 





属性 访问 、 特 性 和 修饰 符 











抽象 基 类 设计 的 一 致 性 

















可 调用 对 象 和 上 下 文 的 使 用 





创建 容器 和 集合 





创建 数值 类 型 








横 切 方 再 




















装饰 器 和 mixin 














用 特殊 方法 实现 
Python 风格 的 类 


通过 重 写 特殊 方法 来 完成 对 Python 内 部 机 制 的 调用 ， 在 Python 











数 就 可 以 重 写 一 个 类 的 ”len _() 方 法 。 


这 意味 着 对 村 











F 像 (len (x 








) ) 这 样 的 通 











月 











态 机 





捉 的 一 部 分 ; 任何 实现 了 len _() 函数 的 类 者 


日 公共 接口 ， 任 何 类 〈 例 
以 实现 它 。 任 何 类 都 可 以 重 写 一 个 像 len_ _() 这 样 的 特殊 方法 ,这样 一 

















是 很 普遍 的 。 例 如 len () 函 





If， 声明 一 个 类 叫 tidy〉 都 可 
种 机 制 构成 了 Python 多 


0 























会 响应 通 


ij 








月 











每 当 定 义 一 个 类 ， 可 以 《而 
本 书 的 第 1 部 分 “用 特殊 方法 实现 Python 风格 的 类 ”是 对 




















创建 的 Python 类 更 





了 Python 

















合 。 这 样 一 来 ， 不 仅 可 以 重 ) 
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E 护 和 扩展 。 
在 某 种 程度 上 ， 
近 Python 语言 的 原 4 
够 最 小 化 。 


NS 
































j 很 多 其 他 语言 现 有 的 功能 和 标准 库 ， 


创建 的 类 都 可 以 作为 Python 扩展 的 
E 类 。 这 样 一 来 ， 在 i 


公共 




















(len (x) ) 中 的 len () 





接 






































[传统 面 
E 何 一 个 类 都 应 当 与 Python 语 





瑟 
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风格 。 性 











应 该 ) 提供 这 些 特 殊 方法 的 实现 来 与 Python 语言 更 好 # 
向 对 象 设 计 的 一 种 延伸 ， 


也 结合 。 
可 以 使 
民 好 地 结 

















其 余 的 任何 原生 部 分 4 
































j 且 编写 的 包 和 模块 也 将 更 容易 























式 来 实 3 


En 。 














开发 下 





都 希望 自己 的 类 














、 标 准 





看 言 之 间 























E 库 之 间 以 及 应 月 


更 接 
序 之 间 的 代码 区 别 就 能 





有 程 











为 了 实现 更 好 的 可 扩展 性 ，Python 语言 提供 了 大 量 的 特殊 方法 ， 它 们 大 致 分 为 以 下 几 类 。 


@ 
object.a 
可 调用 对 象 
(也 是 应 用 于 参数 。) 
集合 (Collections) 




















数字 





上 下 文 《Context): 


特性 访问 (Attribute Access): 
ctribute， 既 可 以 月 


(Callables): 这 个 方法 的 适 月 


: 这 类 方法 提供 了 4 


sequence[index]、 





这 类 特殊 方法 实现 了 对 























供 了 大 量 的 数学 运算 符 和 上 











有 来 赋值 ， 也 可 以 在 del 语句 
月 对 象 为 参数 ， 就 像 Python 内 部 的 len () 函 


民 多 集合 操作 的 功能 。 
mapping[key] 和 some setlanother set。 
(Numbers): 这 类 方法 提 
来 扩展 Python 的 数字 部 分 。 


E 较 运算 符 。 





象 的 特性 访问 ， 使 月 
执行 删除 操作 。 





有 方式 为 














NW 
o 























类 似 这 类 方法 的 使 用 





























可 以 使 用 


法 


日 

















这 类 函数 通常 使 用 with 语句 来 实现 


下 文 的 管理 。 




















@ 和 迭代 器 (Iterator): 可 以 使 用 这 类 方法 定义 迭代 器 ， 通 常 不 需要 考虑 这 部 分 的 扩展 ， 因 为 
生成 器 〈Generator) 已 经 提供 了 非常 优雅 的 实现 。 然 而 ， 我 们 仍 会 探究 如 何 创 建 自 己 的 迭 
代 器 。 
在 Python 3 Object Oriented Programminsg 一 书 中 已 经 介绍 了 这 些 特殊 方法 中 的 一 部 分 ， 以 下 我 
们 将 重新 回顾 这 些 主题 并 对 其 他 属于 基本 范畴 的 特殊 方法 进行 深入 介绍 。 
尽管 是 基础 的 范畴 ， 仍 可 以 针对 其 他 比较 深入 的 主题 进行 讨论 。 这 里 将 会 以 基础 的 几 个 特殊 方 
法 作为 开始 ， 后 续 会 讨论 一 些 高 级 的 特殊 方法 。 
_init () 函数 为 对 象 的 初始 化 操作 提供 了 很 大 的 自由 度 ， 对 于 不 可 变 〔 每 次 操作 都 会 产生 
一 个 新 实例 ) 的 对 象 而 言 ， 声 明和 定义 是 非常 重要 的 。 在 第 1 章 中 ， 我 们 会 讨论 一 些 关 于 这 个 函数 
设计 的 方案 。 

























































































































































































_init () 方 法 的 重要 性 体现 在 两 点 。 首 先 ， 初 始 化 既是 对 象 生命 周期 的 开始 ， 也 是 非常 重 
要 的 一 个 步骤 ， 每 个 对 象 都 必须 正确 地 执行 了 初始 化 才能 够 正常 地 工作 。 其 次 ，_init_() 方 法 
的 参数 可 以 多 种 形式 来 完成 赋值 。 
对 为 init _() 方 法 传 参 方式 的 多 样 化 ， 意 味 着 对 象 的 初始 化 过 程 也 会 有 多 种 。 关 于 这 一 点 
我 们 将 使 用 一 些 有 代表 性 的 例子 对 此 进行 详细 说 明 。 

在 深入 讨论 ”init _() 函数 之 前 ， 需 要 看 一 下 Python 语言 的 类 层次 结构 。 简 单 地 说 ， 所 有 的 
类 都 可 以 继承 opject 类 ， 在 自 定义 类 中 可 以 提供 比较 操作 的 默认 实现 。 

本 章 会 演示 简单 对 象 初始 化 的 不 同形 式 〈 例 如 ， 打 牌 )。 随 后 将 深入 探讨 复杂 对 象 的 初始 化 过 
程 ， 涉 及 集合 以 及 使 用 策略 和 状态 模式 实现 的 玩家 类 。 


1.1 隐 式 的 基 类 一 一 ob ject 


每 个 Python 类 的 定义 都 会 隐 式 继承 自 object 类 ， 它 的 定义 非常 简单 ， 几 乎 什么 行为 都 不 包 
括 。 我 们 可 以 创建 一 个 object 实例 ,但 很 多 事情 无 法 完成 ， 因 为 很 多 特殊 方法 的 调用 程序 都 会 抛 
出 异常 。 
对 于 任何 自 定义 类 ， 都 会 隐 式 继承 ob ject 。 以 下 是 一 个 类 定义 的 示例 〈 隐 式 继承 了 object 























































































































































































































































































































class X: 
Pass 


下 面 是 对 自 定义 类 进行 交互 的 代码 。 


>>> X. class 














<class 'type'> 





>>> XxX. class . base 





<class 'object'> 


可 以 看 到 类 定义 就 是 对 type 类 的 一 个 对 象 的 类 型 声明 ， 基 类 为 opject。 
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相应 地 ， 派 生 自 object 类 
一 些 特殊 方法 的 默认 行为 也 正 是 我 们 想 要 的 。 对 于 一 


1.2 基 类 中 的 _ 


对 象 的 生命 周期 主要 包 # 
专注 于 对 象 的 初始 
object 作为 所 有 类 的 基 类 ， 已 
这 个 函数 。 如 果 没 有 对 它 进 
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__init_() 方 法 


化 。 











iNit 


舌 了 创 

















的 对 象 方法 也 将 继承 各 自 相 应 的 默认 实现 。 





上 











止 c 





茶 些 情况 下 ， 基 类 

















0 万 法 








建 、 初 始 化 和 销毁 。 后 





i 章节 会 详 如 






































经 为 ii 证， 


























这 种 默认 行为 是 可 以 接受 的 。 


对 于 继承 自 object 的 子 类 ， 
不 对 函数 Carea) 所 需要 的 变量 





class Rectangle: 


def areal 


self ) : 


行 重 写 


i 





些 特殊 情况 ， 就 需 需要 重 


这 些 


方法 。 





讨论 对 象 的 创建 和 销毁 ， 本 


We 
产生 其 他 变量 的 实 











总 可 以 对 它 的 导 








return self.length * self.width 


Rectangle 











Python : 


， 这 种 看 








下 面 这 段 


代码 演示 妇 


类 的 drea 





性 进行 扩展 。 例 如 ， 对 于 下 夯 


(width 和 length) 进行 初始 化 。 














函数 在 返回 值 时 使 用 











似 奇怪 的 调 





用 尚未 赋值 属性 的 操作 却 是 合 














>>> r= Rectangle() 
>>> r.length, r.width = 13, 8 


>>>r.area() 
104 


和 





及 了 


此 要 尽量 
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性 赋 




















代 这 种 延迟 赋值 
避免 这 样 的 ) 
然而 ， 这 样 的 设计 
。 这 看 似 是 不 错 的 选择 ， 一 个 可 选 属性 即 可 以 看 





























j 法 。 








1 何 使 / 


的 实现 方式 在 Python : 


[看 似 又 提供 














j 刚 定义 的 Rectangle 类 。 














合法 的 ， 























了 灵活 性 ， 意 味 着 厂 














行 显 式 地 定义 就 可 以 完成 对 原生 机 种 
也 会 相应 产生 很 多 令 人 费 


性 ， 














大 
设计 。 





此 ， 延 迟 初 








在 Zen of python poem 








始 化 


属性 的 设计 在 某 种 











| 的 扩展 。 
f£ 语句 。 
情形 下 可 能 


解 的 i 








了 两 个 属 履 


init 
芷 是 菜子 类 
然而 这 种 多 态 机 制 不 


会 有 用 








般 情 况 下 不 需要 重 写 


























网 。 在 某 些 情况 下 ， 




















网 化 就 











[区 性 和 








法 的 。 





但 是 却 给 调 


可 并 没有 在 人 


用 者 


() 方 法 被 调 
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E 何 地 方 对 


来 了 潜在 的 困惑 ， 








赋值 。 在 


















































时 不 必 为 所 
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一 书 中 曾 提出 过 这 样 的 建议 : 





“ 显 式 而 非 隐 式 ”。 


对 于 每 个 _ 


于 省 主攻 


() 方法 ， 都 应 当 








显 式 地 指 





要 初始 化 的 变量 。 


的 成 员 ， 且 无 须 对 这 个 子 类 进 
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且 给 程序 带 














来 了 隐藏 的 不 确 
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这 样 也 可 能 会 导致 非常 糖 娄 




















的 

















1.3 在 基 类 中 实现 _init (方法 7 


糟糕 的 多 态 

在 只 活性 与 糟糕 之 间 有 一 个 临界 。 

一 旦 发 觉 书写 了 这 样 的 代码 ， 我 们 就 已 经 表 失 了 灵活 性 并 开始 了 
糟糕 的 设计 。 


,7 = De © ht el wee 


try: 
self.x 
except AttributeError: 


这 时 就 要 考虑 添加 一 个 公共 函数 或 属性 来 重 构 这 个 API， 相 比 于 
添加 if 语句 ， 重 构 将 是 更 好 的 选择 。 


1.3 在 基 类 中 实现 _init 0 方法 


通过 实现 ”init _() 方 法 来 初始 化 一 个 对 象 。 每 当 创建 一 个 对 象 ，Python 会 先 创 建 一 个 空 对 
象 ， 然 后 调用 该 对 象 的 _init _() 函数 。 这 个 方法 提供 了 对 象 内 部 变量 以 及 其 他 一 些 一 次 性 过 程 
的 初始 化 操作 。 

以 下 是 关于 一 个 card 类 层次 结构 定义 的 一 些 例子 。 这 里 定义 了 一 个 基 类 和 3 个 子 类 来 描述 carq 
类 的 基本 信息 。 有 两 个 变量 是 参数 直接 赋值 的 ， 另 外 两 个 参数 是 通过 初始 化 方法 计算 来 完成 初始 化 的 。 


class Card: 









































































































































def init ( self, rank, suit ): 
self.suit= suit 
self.rank= rank 
self.hard, self.soft = self. points() 


Q 


lass NumberCard( Card ) : 
def points( self ): 
return int (self.rank), int (self.rank) 
class AceCard( Card ) : 
def points( self ): 
return Ly 1 





class FaceCard( Card ) : 
def points( self ): 





return 10, 10 


























在 以 上 代码 段 中 ，_init () 把 公共 初始 化 方法 引入 到 了 基 类 carqa 中 ， 这 样 3 个 子 类 
NumberCard、AceCard 和 FaceCard 都 能 够 共享 公共 的 初始 化 逻辑 。 
这 是 一 个 常见 的 多 态 设 计 ， 每 个 子 类 为 points () 方法 提供 特有 的 实现 。 所 有 的 子 类 有 相同 
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的 方法 名 和 属性 。 这 3 个 子 类 在 使 用 时 可 以 通过 互 换 对 象 来 更 换 实现 方式 。 
如 果 只 是 简单 地 使 用 字母 来 定义 花色 ， 就 可 以 使 用 如 下 的 代码 段 来 创建 card 对 象 。 


cards = [ AceCard('A', '@'), NumberCard('2',''), NumberCard('3',''), | 













































































这 里 枚 举 了 card 集合 中 的 几 个 card 对 象 ， 把 牌 面值 (rank) 和 花色 (suit) 作为 参数 传 入 来 
实例 化 。 从 长 远 来 看 ， 需 要 一 个 更 智能 的 工厂 函数 来 创建 carg 对 象 ， 因 为 枚 举 所 有 52 张 牌 非常 
麻烦 而 且 容 易 出 错 。 在 介绍 工厂 函数 前 ， 先 看 一 些 其 他 的 问题 。 


1.4 使 用 _init 0 方法 创建 常量 清 E 


我 们 可 以 为 所 有 卡片 的 花色 单独 创建 一 个 类 。 可 在 21 点 应 用 中 ， 花 色 不 是 很 重要 ， 用 一 个 字 
母 来 代替 就 可 以 。 
这 里 使 用 花色 的 初始 化 作为 创建 常量 对 象 的 一 个 实例 。 很 多 情况 下 , 应 用 会 包括 一 个 常量 集合 。 
静态 常量 也 正 构成 了 策略 〈Strategy) 或 状态 〈State) 模式 的 一 部 分 。 
了 些 情况 下 ， 常 量 会 在 应 a dh 或 者 创建 变量 的 行为 是 基于 命令 行 
参数 的 。 我 们 会 在 第 16 章 “ 使 用 命令 行 ”中 介绍 应 用 初始 化 和 启动 的 详细 设计 过 程 。 
Python 中 并 没有 提供 简 i 的 方式 来 定义 一 个 不 可 变 对 象 。 我 们 会 在 第 3 章 “ 属 性 访问 、 
特性 和 修饰 符 ” 中 介绍 如 何 创建 可 靠 的 不 可 变 对 象 。 这 个 例子 中 ， 把 花色 这 个 属性 定义 为 不 可 变 是 
意义 的 。 
如 下 代码 定义 了 一 个 花色 类 ， 可 以 用 来 创建 4 个 花色 常量 。 




















































































































































































































































































































































































































lass. SUit: 





def _init ( self, name, symbol ) : 
self.name= name 


self.symbol= symbol 


如 下 代码 是 对 这 个 类 的 调用 。 

Club, Diamond, Heart, Spade = Suit('Club','®'), Suit('Diamond','9"'), 

Suit ('Heart','Y'), Suit('Spade','s') 

现在 就 可 以 使 用 如 下 代码 创建 Card 对 象 了 。 

cards = [ AceCard('A', Spade), NumberCard('2', Spade), NumberCard('3', Spade), ] 

对 于 以 上 的 这 个 小 例子 来 说 , 这 样 的 方式 相 比 于 简单 地 使 用 一 个 字母 来 代替 花色 的 实现 方式 并 
没有 太 大 的 优势 。 可 在 更 复杂 的 情况 下 ， 可 能 会 需要 创建 一 组 策略 或 状态 模式 对 象 的 集合 。 如 果 把 
创建 好 的 花色 对 象 做 缓存 ， 构 成 一 个 常量 池 ， 使 得 在 调用 时 对 象 可 被 重用 ， 那 么 性 能 将 得 到 显著 的 
提升 。 

我 们 不 得 不 承认 在 Python 中 这 些 对 象 只 是 在 概念 上 是 和 常量， 它们 仍然 是 可 变 的 。 使 用 额外 的 
代码 实现 使 得 这 些 对 象 成 为 完全 不 可 变 的 可 能 会 更 好 。 
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Ma 


通过 


工 上 
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无 关 紧要 的 不 可 变性 
不 可 变性 可 能 显得 很 有 诱 患 力 。 有 时 一 些 “ 恶 意 程序 员 ” 会 修改 


应 用 程序 中 的 常量 。 从 设计 的 角度 来 看 ， 这 是 思春 的 ， 即 使 不 可 
变 变 量 也 无 法 阻止 这 种 恶意 行为 。 没 有 任何 简单 的 方法 能 够 阻止 
这 种 恶意 行为 ， 程 序 员 对 代码 进行 恶意 修改 就 像 他 们 可 以 修改 一 
个 常量 那样 简单 。 

不 再 纠结 于 如 何 把 类 定义 为 不 可 变通 常 是 更 好 的 选择 。 在 第 3 章 
“属性 访问 、 特 性 和 修饰 符 ” 中 ， 我 们 会 介绍 不 可 变性 的 几 种 实 
现 方法 来 为 有 bug 的 程序 提供 适当 的 诊断 信息 。 


浮 数 调用 _init 0 














] 可 以 使 / 








定义 一 个 函 


定义 一 个 类 ， 


的 。 在 类 似 
类 而 单独 存 

















在 Python 里 ， 类 定义 不 是 必需 的 。 仅 当 





之 一 是 ， 


如 果 需 要 ,我们 总 可 以 将 函数 重 写 为 合适 的 可 调 ) 


了 工 | 
实现 工厂 有 两 种 途 














函数 来 完成 所 有 card 对 象 的 创建 ， 这 比 枚 举 52 张 牌 的 方式 好 很 


径 





o 


数 ， 返 回 不 同类 的 对 象 。 
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有 ,工厂 类 层次 结构 是 必需 的 ， 因 为 语 








Java 这 样 的 
在 的 函数 。 











特别 复杂 的 情形 ， 了 
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对 了 
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能 做 到 的 事情 没 必要 去 定义 类 层次 结构 。 





地 定义 一 个 函数 台 
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| 嫩 习 








只 需要 
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用 对 象 进 











绍 可 调 | 





j 对 象 。 











步 重 构 为 工厂 类 的 层次 结构 。 我 们 
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尽管 本 书 
中 也 是 常见 的 、 惯 用 的 。 











] 对象。 进行 ] 





























从 大 体 上 来 看 ， 类 定义 的 优势 是 : 可 以 通过 继承 来 使 得 代码 可 以 被 更 好 地 重用 。 工 厂 类 封 
类 本 身 的 层次 结构 以 及 对 象 构建 的 复杂 过 程 。 
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， 可 以 通过 添加 子 类 





对 于 已 有 的 工 ) 











包含 了 创建 对 象 的 方法 。 这 是 完整 的 工厂 设计 模式 ， 正 如 设计 模式 了 


本 身 不 支持 可 以 脱离 


的 是 面向 对 象 编程 , 但 函数 式 编程 在 Python 的 世界 


[ 厂 模式 设计 时 ， 也 可 以 将 可 
将 在 第 5 章 “ 可 调用 对 象 和 上 下 文 的 使 用 


多 。 在 Python 
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[ 厂 类 才 是 不 错 的 选择 。Python 的 优势 
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的 方式 来 完成 











扩展 ， 这 样 就 获得 了 工厂 类 的 多 态 设计 ,不 同 的 工厂 类 名 有 相同 的 方法 签名 并 可 以 妊 
换 对 象 来 改变 具体 实现 。 
FP 类 级 别 的 多 态 书 
成 目标 代码 时 妇 


这 利 
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译 器 在 
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来 说 是 非常 有 | 

















几 制 对 于 类 似 Java 和 C++ 这 样 
定 类 和 方法 的 实现 细节 。 
F 没 有 重用 任何 代码 ， 那 么 类 
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全 可 以 使 用 函数 来 蔡 代 。 
以 下 是 用 来 生成 carq 子 类 对 象 的 一 个 工厂 函数 的 例子 。 


def card( rank, suit ): 





if rank == 1: return AceCard( 'A', suit ) 
elif 2 <= rank < 11: return NumberCard( str(rank), suit ) 
elif 11 <= rank < 14: 
name = { 11: 'J', 12: 'Q0', 13: 'K' }[rank] 
return FaceCard( name, suit ) 
else: 





raise Exception( "Rank out of range" ) 

这 个 函数 通过 传 入 牌 面值 rank 和 人 花色 值 suit 来 创建 card 对 象 。 这 样 一 来 ， 创 建 对 象 的 工 
作 更 简便 了 。 我 们 已 经 把 创造 对 象 的 过 程 封 装 在 了 单独 的 工厂 函数 内 ， 外 界 无 需 了 解 对 象 层 次 结构 
以 及 多 态 的 工作 细节 就 可 以 通过 调用 工厂 函数 来 创建 对 象 。 

如 下 代码 演示 了 如 何 使 用 工厂 函数 来 构造 deck 对 象 。 


deck = [card(rank, suit) 





































































































for rank in range(1,14) 
for suit in (Club, Diamond, Heart, Spade)] 


这 段 代码 枚 举 了 所 有 牌 面值 和 花色 的 牌 ， 完 成 了 52 张 牌 对 象 的 创建 。 
1.5.1 错误 的 工厂 设计 和 模糊 的 else 语句 


这 里 需要 注意 card () 函数 里 的 if 语句 。 并 没有 使 用 一 个 catch-all else 语句 做 一 些 其 他 步 又 ， 
而 只 是 单纯 地 抛 出 了 一 个 异常 。 像 这 样 的 catch-all else 语句 的 使 用 方式 是 有 争议 的 。 

一 方面 , else 语句 不 能 不 做 任何 事情 ， 因 为 这 将 隐藏 微小 的 设计 错误 。 另 一 方面 , 一 些 else 
语句 的 意图 已 经 很 明显 了 。 
忆 此 ， 避 免 模 糊 的 else 语句 是 非常 重要 的 。 
关于 这 一 点 ， 可 以 参照 以 下 工厂 函数 的 定义 。 


def card2( rank, suit ) : 
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if rank == 1: return AceCard( 'A', suit ) 
elif 2 <= rank < 11: return NumberCard( str(rank), suit ) 
else: 

nane = :{ LT1s TT 12s TO 13% TK [EankK] 

return FaceCard( name, suit ) 


创建 纸牌 对 象 可 以 通过 如 下 代码 实现 。 


deck2 = [card2(rank, suit) for rank in range(13) for suit in (Club, 
































Diamond, Heart, Spade)] 
这 是 最 好 的 方式 吗 ? 如 果 if 条 件 更 复杂 些 呢 ? 
一 些 程序 员 可 以 很 快 理解 这 样 的 if 语句 , 而 另 一 些 则 会 纠结 于 是 否 要 对 if 语句 的 逻辑 做 进 一 









































步 划 分 。 


作为 高 级 的 Python 程序 员 ， 我 们 不 应 该 把 else 语句 的 意 








图 应 当 是 非常 直接 的 。 








什么 时 候 使 用 catch-all 语 名 
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图 留 给 读者 去 推 上 晰 ， 条 件 语 句 的 意 





很 少 ， 仅 当 条 件 非 常 明确 时 才 使 用 。 如 果 条 件 不 够 明确 ， 使 用 
else 语句 将 抛 出 异常 。 因 此 要 避免 使 用 模糊 的 else 语句 。 


1.5.2 ”使 用 elif 简化 设计 来 获得 一 致 性 


工厂 方法 cardq() 中 包括 了 两 个 很 常见 的 结构 。 





if-elif 序列 。 
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我 们 总 可 以 
换 为 映射 有 时 是 











风险 的 。) 























为 了 简单 化 ， 重 构 将 是 更 好 的 选择 。 
使 用 elif 条 件 语句 代 蔡 映射 。 








以 下 是 没有 使 用 映射 Card 工厂 类 的 实现 。 


def card3( rank, suit ) : 
if rank == 1: 
elif 2 <= rank < 11: 


elif rank == 11: 
return FaceCardl( 
elif rank == 12: 
return FaceCard( 
elif rank == 13: 
return FaceCard( 





人 LSe : 





raise ExXxception( 

















return AceCard ( 
return NumberCard ( 


(Lt 


"AI suit ) 


“OTSUiE) 


'K', 





suit ) 


"Rank out of range" ) 


总 可 以 。 反 过 来 却 不 行 ， 把 elif 条 件 








str(rank), suit ) 





这 里 重 写 了 card () 工厂 方法 ， 将 映射 转换 为 了 elif 语句 。 比 起 前 一 个 版 本 ， 这 个 函数 在 实 














现 上 获得 了 更 好 的 一 致 性 。 


1.5.3 “使 用 喘 射 和 类 来 简化 设计 














在 一 些 情 























十 洲 目 AS 


本 生计 7 






































区 下 ， 可 以 使 用 映射 而 非 这 相 
件 语 句 链 是 表达 人 逻辑 的 唯一 明智 的 方式 , 忆 
样 的 事情 采用 映射 完成 的 代码 可 以 更 好 地 工作 
1 级 别 的 对 象 ， 从 rank 


的 一 个 elif 条 件 语句 链 。 如 果 认为 使 / 
bP 么 很 容易 会 发 现 ， 它 看 起 来 很 复杂 。 对 于 简单 的 情 











， 而 























这 个 card 工厂 类 就 是 使 





参数 映射 
j 映 射 实现 的 版 本 。 





尺码 的 可 读 性 也 更 强 。 


下 














一 个 elif 条 


， 做 同 
























































到 对 象 是 很 容易 的 事 ' 


于 
由 
o 
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def card4( rank, suit ) : 
class = {1: AceCard, 11: FaceCard, 12: FaceCard, 
13: FaceCard} .get (rank, NumberCard) 
return class ( rank, suit ) 


我 们 把 rank 映射 为 对 象 ， 然 后 又 把 rank 值 和 suit 值 作为 参数 传 入 Card 构造 函数 来 创 
建 card 实例 。 

也 可 以 使 用 一 个 sefaultdict 类 , 然而 比 起 简单 的 静态 映射 
它 的 实现 。 


defaultdict( lambda: NumberCard, {1: AceCard, 11: FaceCard, 12: 
FaceCard, 13: FaceCard} ) 






































I 

















实 并 没有 简化 多 少 。 下 例 就 是 











defaultdict 类 的 默认 构造 函数 必须 是 无 参 的 。 我 们 使 用 了 一 个 Lambqa 构造 函数 作为 常量 
的 封装 函数 。 这 个 函数 有 个 很 明显 的 缺陷 ， 缺 少 从 1 到 A 和 13 到 天 的 映射 。 当 试图 添加 这 段 代 码 
逻辑 时 ， 就 遇 到 了 问题 。 
我 们 需要 修改 映射 逻辑 ， 除 了 提供 card 子 类 ， 还 需要 提供 rank 对 象 的 字符 串 结果 。 如 何 实 
现 这 两 部 分 的 映射 ? 有 4 种 常见 的 方案 。 
@ 可 以 建立 两 个 并 行 的 映射 。 此 处 并 不 推荐 这 种 做 法 ， 后 面 的 章节 会 说 明 为 什么 这 样 做 是 不 值得 的 。 
@ 可 以 映射 为 一 个 二 元 组 。 当 然 ， 这 个 方案 也 有 一 些 弊端 。 
@ 可 以 映射 为 partial() 函数 。partial() 函数 是 functools 模块 的 一 个 功能 。 
@ ”也 可 以 考虑 修改 类 定义 来 完成 映射 逻辑 。 在 下 一 节 里 会 介绍 如 何在 子 类 中 重 写 _init __() 治 
对 于 每 个 方案 我 们 会 通过 具体 示例 逐一 演示 。 
1. 并 行 映射 
以 下 是 此 方案 代码 的 基本 实现 。 


class = {1: AceCard, 11: FaceCard, 12: FaceCard, 13: FaceCard 
}.get (rank, NumberCard) 

rank str= {1:'A', 11:'J', 12:'Q', 13:'K'}.get (rank,str (rank)) 
return class ( rank str, suit) 


这 样 是 不 值得 的 。 这 种 实现 方式 带 来 了 映射 键 1、11、12 和 13 的 逻辑 重复 。 重 复 是 糟糕 的 ， 
因为 软件 更 新 后 通常 会 带 来 对 并 行 结构 多 余 的 维护 成 本 。 


>» 不 要 使 用 并 行 结构 
Q 并 行 结构 应 该 被 元 组 或 一 些 更 好 的 组 合 所 代替， 


2. 了 映射 到 一 个 牌 面值 的 元 组 
以 下 代码 演示 了 如 何 映射 到 二 元 组 的 基本 实现 。 















































































































































































































































ClLass , 
es 


rank_ 


str= { 


(AceCard, 'A'), 


11: (FaceCard, 'J'), 
12: (FaceCard,'Q'), 
13: (FaceCard, 'K'), 


} .get (rank, 


return class_ 


这 个 方案 看 起 来 还 不 错 。 








( rank str, suit ) 














并 没有 太 多 代码 来 完成 特殊 情 


(NumberCard, str (ank) ) ) 


1.5 通过 工厂 函数 调用 




















的 处 班 








改 Card 类 层次 结构 时 : 添加 一 个 card 子 类 时 ， 如 何 来 修改 和 扩展 。 


映射 到 一 个 相对 简 


从 rank 值 映 射 为 类 对 象 是 很 少见 的 ， 而 且 两 个 参数 ， 
的 类 或 函数 对 象 ， 而 不 必 提 供 


























只 有 



































个 上 
/ 甩 了 























_init 0 13 


。 接 下 来 我 们 会 看 到 当 需 要 修 





对 象 的 初始 化 。 从 rank 
目的 不 明确 的 参数 ， 这 才 是 明智 的 选择 。 








3. partial 函数 设计 

除了 映射 到 二 元 组 函数 和 只 提供 一 个 参数 来 实例 化 的 方案 外 ， 我 们 还 可 以 创建 partial() 函 
数 。 这 个 函数 可 以 用 来 实现 可 选 参数 。 我 们 会 从 functools 库 中 使 用 partial() 函数 创建 一 个 
带 有 rank 参数 的 部 分 类 。 


以 下 演示 了 如 何 建立 从 rank 到 partial () 


from functools import partial 


part class= { 
1: 
Fl: 
12: 


13: partial (FaceCard, 


partial (FaceCard, 
partial (FaceCard, 


partial (AceCard, 'A'), 


) 
'J'), 
"Q')v 
'K'), 


}.get (rank, partial (NumberCard, str(rank))) 
return part class( suit ) 





[Te 


通过 调 | 3 



































使 用 














可 


partiall 


以 是 先 调 ) 


数 式 编 























大 致 上 


Patrtial() 


程 中 是 很 常见 的 ， 当 使 
， partiall( 


版 本 来 做 同样 的 事 














赋 信 



































的 是 函 

















情 








。 partial () 








4. 工厂 模式 的 流畅 AP1 设 计 





ee 
函数 的 方式 非常 


这 样 的 函 




















类 似 。 


数 调用 x.a() .b 






































用 partial () 


jx.a() 髓 





) 函数 在 面向 对 象 编程 : 


的 方法 必须 按 特定 的 顺序 来 调 

















用 。 


。 对 于 x(a,b) 这 个 函数 ， 放 在 partial ( 








调用 b 





这 意味 着 Python 
() 函数 。 





b () 函数 ， 5 可 以 剧 


























在 管理 状态 方面 提供 J 






































于 两 种 方式 是 等 价 


不 是 很 常用 。 我 们 可 
函数 和 构造 对 象 时 的 流畅 接 


的 ， 因而 可 以 把 partial () 


函数 的 映射 来 完成 对 象 的 初始 化 。 





partiall 











以 考虑 使 用 。 


给 part_class， 完 成 了 与 rank 对 象 的 关联 。 可 以 
同样 的 方式 创建 suit 对 象 ， 并 完成 最 终 carq 对 象 的 创建 。 
数 而 非 对 象 方法 的 时 候 就 可 

















) 函数 的 使 用 在 

















口 很 类 似 。 


这 种 按 顺序 调用 的 方法 和 创建 


E 解 为 x(a)(D)。 
我 们 可 以 直接 更 新 对 象 或 者 对 具有 状态 的 对 象 使 








以 简单 地 提供 








构造 函数 的 不 








() 函数 的 实现 就 可 























函数 重 构 为 工厂 对 象 创建 的 流畅 
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接口 。 我 们 在 流畅 接口 函数 中 设置 可 以 反馈 selLf 值 的 rank 对 象 ， 然 后 传 入 花色 类 从 而 创建 Card 实例 。 
以 下 是 card 工厂 流畅 接口 的 定义 ， 包 含 了 两 个 函数 ， 它 们 必须 按 顺序 调用 


class CardFactory: 
def rank( self, rank ): 
self.class , self.rank str= { 

1: (AceCard, 'A'), 
11: (FaceCard, 'J'), 
12: (FaceCard, 'Q'), 
13: (FaceCard, 'K'), 
} .get (rank, (NumberCard, str (rank))) 









































o 


return self 
def suit( self, suit ) : 


return self.class ( self.rank str, suit) 
先是 使 用 rank () 函数 更 新 了 构造 函数 的 状态 ， 然 后 通过 suit () 函数 创造 了 最 终 的 Card 对 象 。 
这 个 工厂 类 可 以 以 如 下 方式 来 使 用 


card8 = CardFactory() 
























































o 





deck8 = [card8.rank (r+1) .suit(s) for r in range(13) for s in (Club, 
Diamond, Heart, Spade)] 


我 们 先 实例 化 一 个 工厂 对 象 ， 然 后 再 创建 Card 实例 。 这 种 方式 并 没有 利用 init () 在 carg 
类 层次 结构 中 的 作用 ， 改 变 的 是 调用 者 创建 对 象 的 方式 。 


1.6 在 每 个 子 类 中 实现 _init 0 方法 


正如 介绍 工厂 函数 那样 ， 这 里 我 们 也 先 看 一 些 carg 类 的 设计 实例 。 我 们 可 以 考虑 重 构 rank 数 
直 转 换 的 代码 ， 并 把 这 个 功能 加 在 card 类 上 。 这 样 就 可 以 把 初始 化 的 工作 分 发 到 每 个 子 类 来 完成 。 
这 通常 需要 在 基 类 中 完成 一 些 公共 的 初始 化 逻辑 ， 子 类 中 完成 各 自 特殊 的 初始 化 逻辑 。 我 们 需 
要 遵守 不 要 重复 自己 (Don't Repeat Yourself，DRY) 的 原则 来 防止 子 类 中 的 代码 重复 。 
以 下 代码 演示 了 如 何 把 初始 化 职责 分 发 到 各 自 的 子 类 中 。 


class Card: 




























































































ES 













































































Pass 
class NumberCard( Card ) : 
def init ( self, rank, suit ) : 


self.suit= suit 
self.rank= str (rank) 
self.hard = self.soft = rank 
class AceCard( Card ) : 
def init ( self, rank, suit ): 
self.suit= suit 
self.rank= "A" 
self.hard, self.soft = 1, 11 
class FaceCard( Card ) : 
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def init ( self, rank, suit ) : 
self.suit= suit 
SElf., rank= tl TJ, 2 QO 3 TK [Eank] 
self.hard = self.soft = 1 








欢迎 的 重复 代码 。 以 上 代 
适 。 我 们 可 以 在 子 类 中 显 











人 
式 调用 基 类 的 ”init _() 方 法 。 

以 下 代码 演示 了 如 何 把 _init _() 方 法 提 到 基 类 carqa 中 实现 的 过 程 ， 然 后 在 子 类 中 可 以 重用 
车 类 的 实现 。 


class Card: 
def init ( self, rank, suit, hard, soft ) : 























| t 





















































| 


self.rank= rank 
self.suit= suit 
self.hard= hard 
self.soft= soft 
class NumberCard( Card ) : 














def jinit ( self, rank, suit ): 
super(). init ( str(rank), suit, rank, rank ) 
class AceCard( Card ) : 
def init ( self, rank, suit ): 
super()._ init ( "A", suit, 1, 11 ) 
class FaceCard( Card ) : 
def init ( self, rank, suit ): 
SUPer () wntit e( Lle SI, 2 OV pL3E WK. hrankly Sulity 
下 07 -10 :) 























我 们 在 子 类 和 基 类 中 都 提供 了 _init __() 方法 的 实现 , 这 样 会 在 一 定 程度 上 简化 工厂 函数 的 逻 
辑 ， 如 下 面 代码 段 所 示 。 


def cardl0( rank, suit ) : 
if rank == 1: return AceCard( rank, suit ) 
elif 2 <= rank < 11: return NumberCard( rank, suit ) 
elif 11 <= rank < 14: return FaceCard( rank, suit ) 



































else: 
raise Exception( "Rank out of range" ) 














仅仅 是 简化 工 广 函数 不 应 该 是 我 们 重 构 焦 点 的 全 部 。 我 们 还 应 该 看 到 这 次 的 重 构 导致 
_ init _() 方 法 变 得 复杂 了 ， 做 这 样 的 权衡 是 正常 的 。 











使 用 工厂 函数 封装 复杂 性 
-» 在: 33 ee 常 直接 调用 比 
Q “程序 员 的 _init _() 函数 并 把 复杂 | ， 工厂 函数 更 好 。 
当 需 要 封装 复杂 的 构造 函数 逻辑 时 考虑 使 用 工厂 函数 则 更 好 。 
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人 


一 个 组 合 对 象 也 可 以 称 作 容 器 。 我 们 会 从 一 个 简单 的 组 合 对 象 开 始 介绍 : 一 吕 





第 1 章 _init_ (0 方法 


7 简单 的 组 合 对 象 

















ie 


。 过 























的 集合 对 象 。 我 们 的 确 可 以 简单 地 使 用 一 个 1ist 来 代替 一 副 牌 〈deck) 对 象 。 


在 设计 一 个 类 之 前 ， 我 们 需要 考虑 































































































这 是 一 个 基本 





这 样 的 一 个 问题 :简单 地 使 用 1ist 是 合适 的 做 法 吗 ? 


可 以 使 用 random.shuffle() 函数 完成 洗 牌 操作 ， 使 用 qeck .pop () 来 完成 发 牌 操作 。 
些 程序 员 可 能 会 过 早 定义 新 类 ， 正 如 像 使 用 内 置 类 一 样 ， 违 反 了 一 些 面 向 对 象 的 设计 原则 。 
比如 像 下 面 的 这 个 设计 。 



































d= [card6 (r+l,s) for r in range(13) for s in (Club, Diamond, Heart, 
Spade)] 

random.shuffle (d) 

hand= [ d.pop(), d.pop() ] 


可 如 果 业 务 逻 辑 这 么 简单 的 话 ， 为 什么 要 定义 新 类 ? 



































这 里 没有 明确 的 答案 。 类 定义 的 一 个 优势 是 : 类 给 对 象 提供 了 简单 的 、 不 需要 实现 的 接口 。 正 















































如 之 前 在 对 工厂 的 设计 讨论 时 所 看 到 的 ， 对 于 Python 来 说 ， 类 并 不 是 必需 的 。 
在 之 前 的 例子 中 ， 有 两 个 关于 Deck 的 使 用 实例 而 且 类 定义 似乎 并 不 能 过 于 简化 。 这 有 个 很 大 
的 好 处 是 它 隐藏 了 具体 的 实现 。 而 由 于 细节 过 于 细微 因此 暴露 它们 并 不 需要 太 高 的 维护 成 本 。 本 章 






















































































































































































设计 集合 类 ， 通 常 有 如 下 3 种 策略 。 
站 ， 



































主要 专注 于 init () 方 法 ， 因 此 接 下 来 会 讨论 一 些 关 于 如 何 创建 和 初始 化 一 个 集合 的 设计 。 




















@ 封装 
@ 扩展 : 这 个 设计 是 对 现 有 集合 类 进行 扩展 ， 通 常 使 用 定义 子 类 的 方式 来 实现 。 
@ 创建 : 即 重新 设计 。 在 第 6 章 “ 创 建 容 器 和 集合 ”: I 
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这 3 个 方面 是 面向 对 象 设计 的 核心 。 我 们 在 设计 一 个 类 时 ， 总 需要 谨慎 考虑 再 做 


1.7.1 封装 集合 类 




















以 下 是 对 内 部 集合 进行 封装 的 设计 。 


class Deck : 
def _ init ( self ) : 
self. cards = [card6 (r+l,s) for r in range(13) for s in (Club, 
Diamond, Heart, Spade)] 
random.shuffle( self. cards ) 
def Pop( self ): 
return self. cardqs.pop () 























我 们 已 经 定义 了 Deck 类 ， 内 部 实际 调用 的 是 1ist 对 象 。Deck 类 的 pop () 方法 只 





对 象 相应 函数 的 调用 。 





: 这 个 设计 是 基于 现 有 集合 类 来 定义 一 个 新 类 ， 属 于 外 观 模式 的 一 个 使 用 场景 。 


出 选择 。 





是 对 List 
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我 们 可 以 使 用 以 下 代码 来 创建 一 个 Hand 对 象 : 

d= Deck () 

hand= [ d.pop(), d.pop() ] 

一 般 来 说 ， 外 观 模式 或 者 封装 类 中 的 方法 实现 只 是 对 底层 对 象 相应 函数 的 代理 调用 。 有 时 候 这 样 的 
代理 未 免 显得 有 些 多 余 ， 因 为 对 于 复杂 的 集合 ， 我 们 需要 代理 大 量 的 函数 来 更 完整 地 封装 这 个 底层 对 象 。 


1.7.2 扩展 集合 类 


类 设计 的 另 一 个 选择 是 扩展 现 有 类 。 这 样 做 的 好 处 是 不 需要 再 重新 实现 已 有 的 pop () 方法 了 ， 
只 需 简单 地 继承 即 可 。 重 用 pop () 方法 的 好 处 是 ,无 需 编 写 太 多 代码 就 可 以 创建 一 个 类 。 在 这 个 例 
子 中 ， 扩 展 1ist 类 引入 了 很 多 我 们 实际 并 不 需要 的 函数 。 

以 下 代码 演示 了 基于 对 内 部 集合 类 扩展 的 Deck 类 的 定义 。 

class Deck2( list ): 

def _ init ( self ): 
super(). init ( card6(r+l,s) for r in range(13) for s in 

(Club, Diamond, Heart, Spade) ) 
random.shuffle( self ) 

在 一 些 情形 下 ， 在 子 类 中 需要 显 式 调用 
的 章节 中 会 看 到 其 他 一 些 例子 。 
我 们 使 用 了 基 类 中 的 ”init _() 函数 来 初始 化 1ist 对 象 进 而 构造 了 一 个 对 象 集合 。 然 后 进 
行 洗 牌 操作 。pop () 函数 只 需 继承 自 1ist 集合 就 可 以 很 好 地 工作 了 ， 其 他 函数 也 一 样 。 


1.7.3 可 适应 更 多 需求 的 另 一 种 设计 
在 玩 牌 时 ， 牌 通常 会 从 一 个 发 牌 机 中 取出 ， 这 个 容器 通常 包含 了 混在 一 起 的 6 副 牌 。 这 样 就 需 
要 我 们 来 创建 一 个 自 定 义 的 Deck 类 而 不 再 只 是 简单 地 从 1ist 对 象 继承 。 
进一步 说 ， 发 牌 机 并 未 完全 发 牌 ， 而 是 插入 一 个 标记 牌 。 由 于 有 一 张 标记 牌 ， 有 些 牌 就 被 有 效 
地 分 开 了 。 
以 下 是 一 个 Deck 类 的 定义 ， 包 含 了 多 副 牌 ， 每 副 牌 有 52 张 牌 。 


class Deck3(1ist) : 
def init (self, decks=1): 
super(). init () 












































































































































































































































类 的 函数 来 完成 适当 的 实现 。 关 于 这 一 点 ， 在 接 下 来 
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for i in range (decks): 
self.extend( card6é (r+l,s) for r in range(13) for s in 
(Club, Diamond, Heart, Spade) ) 
random.shuffle( self ) 
burn= random.randint (1, 52) 
for i in range (burn): self.pop() 


这 里 我 们 使 用 了 基 类 的 ”init _() 函数 来 创建 一 个 空 集合 。 然 后 调用 self .extend () 函数 来 把 
多 副 牌 加 载 到 发 牌 机 中 。 由 于 我 们 没有 在 子 类 重 写 super () .extend() 函数 ， 因 为 我 们 也 可 以 直 
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相应 的 实现 。 
我 们 也 可 以 使 用 更 底层 的 表达 式 生成 器 通过 调用 super () . init _() 函数 来 实现 ， 如 以 下 
代码 所 示 。 


( card6 (r+l,s) for r in range(13) for s in (Club, Diamond, Heart, 





基 类 





接 调 






































Spade) for d in range(decks) ) 
这 个 类 提供 了 一 副 牌 card 实例 的 集合 ， 可 以 用 来 模拟 21 点 中 的 发 牌 机 的 发 牌 过 程 。 
销 牌 时 ， 有 一 个 特殊 的 过 程 。 在 我 们 设计 玩家 的 纸牌 计数 策略 时 ， 也 要 考虑 到 这 个 细节 。 


1.8 复合 的 组 合 对 象 


为 了 描述 21 点 游戏 中 的 发 牌 。 以 下 代码 定义 了 Hand 类 ， 用 来 模拟 打牌 策略 。 


class Hand : 

def init ( self, dealer card ) : 
self.dealer card= dealer card 
self.cards= [] 

def hard total (self ) : 
return suml(c.hard for c in self.cards) 

def soft total (self ) : 
return suml(c.soft for c in self.cards) 
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在 本 例 中 , 定义 了 一 个 self .dealer card 变量 , 值 由 init () 函数 传 入 。 可 self.cards 
变量 不 基于 任何 参数 来 赋值 ， 只 是 创建 了 一 个 空 集合 。 使 用 如 下 代码 可 以 创建 一 个 Hand 实例 。 












































Q = Deck() 

h = Hand( d.pop() ) 
h.cards.append( d.pop() ) 
h.cards.append( d.pop() ) 














可 是 这 段 代码 有 个 缺陷 ， 需 要 用 好 几 行 代码 来 构造 一 个 Hang 对 象 。 不 但 给 序列 化 Hand 对 象 带 
来 了 困难 ,而且 再 次 创建 对 象 又 需要 再 重复 以 上 过 程 。 尽 管 再 添加 一 个 append () 函数 暴露 给 外 面 
调用 ， 也 仍然 需要 很 多 步骤 来 创建 集合 对 象 。 

可 能 会 考虑 使 用 流畅 接口 ， 但 那样 并 不 能 简化 实际 问题 。 它 只 是 在 创建 Hand 对 象 的 语法 上 做 
了 一 些 改变 。 流 畅 接 口 依然 会 需要 多 个 步骤 来 创建 对 象 。 在 第 2 部 分 “持久 化 和 序列 化 ”中 ， 我 们 
需要 一 个 接口 完成 类 之 间 的 调用 ， 可 以 通过 类 中 的 一 个 函数 完成 ， 而 这 个 函数 最 好 是 构造 函数 。 在 
第 9 章 “ 序 列 化 和 保存 一 一 JSON、YAML、Pickle、CSV 和 XML” 中 会 详细 深入 介绍 。 

可 以 注意 到 harq_ total 函数 和 soft total 函数 并 没有 完全 符合 21 点 的 规则 。 在 第 2 章 
“与 Phthon 无 颖 集成 一 一 基本 特殊 方法 ”中 会 对 这 个 问题 进行 讨论 。 


完成 组 合 对 象 的 初始 化 


__init _() 初始 化 方法 应 当 返 回 一 个 完整 的 对 象 ， 这 样 是 理想 的 情况 。 而 这 样 也 带 来 了 一 些 
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复杂 性 ， 因 为 要 创建 的 对 象 内 部 可 能 包含 了 集合 ， 集 合 里 面 又 包含 了 其 他 对 象 。 如 果 可 以 一 步 完 成 


对 象 创建 的 工作 这 样 是 最 好 的 。 
通常 考虑 使 用 一 个 流畅 接口 来 完成 逐个 将 对 象 添加 到 集合 的 操作 ， 同 时 将 集合 对 象 作为 构造 函 




































































数 的 参数 来 完成 初始 化 。 








例如 ， 如 下 代码 段 对 类 的 实现 。 


class Hand2: 


def init ( self, dealer card, *cards ): 
self.dealer card= dealer card 
self.cards = list (cards) 
def hard total (self ): 
return suml(c.hard for c in self.cards) 
def soft total (self ): 
return suml(c.soft for c in self.cards) 


























代码 中 的 初始 化 函数 中 完成 了 所 有 变量 实例 的 赋值 操作 。 其 他 函数 的 实现 都 是 从 上 一 个 Hang 


类 的 版 本 中 复制 过 来 的 。 此 处 可 以 用 两 种 方式 来 创建 Hand2 对 象 。 第 1 种 是 一 次 加 载 一 张 牌 。 



























































d = Deck() 
P = Hand2( d.pop() ) 
p.cards.append( d.pop() ) 


p.cards.append( d.pop() ) 


第 2 种 使 用 *cards 参数 一 次 加 载 多 张 牌 。 


(el 
hn 


第 2 种 初始 化 方式 给 单元 测试 代码 带 来 了 便利 ,构造 一 个 复合 对 象 只 需 一 步 。 更 重要 的 是 , 一 


Deck () 
Hand2( d.pop(), d.pop(), d.pop() ) 























步 构造 复合 对 象 也 有 利于 后 续 要 介绍 的 序列 化 。 


1.9 不 带 _init 0 方法 的 无 状态 对 象 


略 对 
身 j 











以 下 是 一 个 不 需要 _ init _() 方法 的 类 定义 。 对 于 策略 模式 的 对 象 来 说 这 是 常见 的 设计 。 一 个 策 
象 以 插件 的 形式 复合 在 主 对 象 上 来 完成 一 种 算法 或 多 和 匈 。 它 或 许 依赖 主 对 象 中 的 数据 ,策略 对 象 自 
不 携带 任何 数据 。 通 常 策略 类 会 和 享 元 设计 模式 一 起 使 用 : 在 策略 对 象 中 避免 内 部 存储 。 所 有 需要 











































































































的 值 














都 从 策略 对 象 的 方法 参数 传 入 。 策 略 对 象 自身 是 无 状态 的 ， 可 以 把 它 看 作 是 一 系列 函数 的 集合 。 
这 里 定义 了 一 个 类 给 Player 实例 提供 游戏 模式 的 选择 ， 以 下 这 个 策略 包括 了 拿 牌 和 下 调 投注 。 




















class GameStrategy: 
def insurance( self, hand ) : 
return False 
def split( self, hand ) : 
return False 
def doublel( self, hand ) : 
return False 
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def hit( self, hand ) : 
return suml(c.hard for c in hand.cards) <= 17 


每 个 函数 需要 传 入 已 有 的 Hang 对 象 。 函数 逻辑 所 需 的 数据 基于 现 有 的 可 用 信息 ， 意 味 着 数据 
会 来 自 庄 家 和 玩家 手中 的 牌 。 
我 们 可 以 创建 一 个 单 例 的 策略 对 象 给 多 个 玩家 实例 来 调用 


dumb = GameStrategy () 


我 们 也 可 以 根据 21 点 给 玩家 提供 的 不 同 玩法 ， 考 虑 定义 一 系列 像 这 样 的 策略 对 象 。 
1.10 一 些 其 他 的 类 定义 


正如 前 面 所 提 到 的 , 玩家 有 两 种 策略 : 下 注 和 打牌 。 每 个 Player 实例 会 和 模拟 器 进行 很 多 交 
互 。 我 们 这 里 把 这 个 模拟 器 命名 为 Table 类 。 

Table 类 的 职责 需要 配合 Player 实例 完成 以 下 事件 。 

@ 玩家 必须 基于 玩 牌 策略 初始 化 一 个 牌 局 。 

@ 随后 玩家 会 得 到 一 手 牌 。 

@ ”如 果 手 中 的 牌 是 可 以 拆 分 的 , 玩家 需要 在 基于 当前 玩法 的 情况 下 决定 是 否 分 牌 。 这 会 创建 

新 的 Hand 对 象 。 在 一 些 场合 中 ， 新 分 出 去 的 牌 是 可 以 再 分 的 。 

@ ”对 于 每 个 Hand 实例 ， 玩 家 必须 基于 当前 玩法 决定 叫 牌 、 双 倍 还 是 停 叫 。 

@ 然后 玩家 会 收 到 账单 ， 他 们 可 以 根据 输赢 情况 来 决定 之 后 的 游戏 策略 。 

基于 以 上 需求 ， 我 们 可 以 看 出 Table 类 需要 提供 一 些 API 函数 来 获取 牌 局 、 创 建 Hand 对 象 、 分 牌 、 
提供 单 手 和 多 手 策略 以 及 支付 ， 这 个 对 象 的 职责 很 多 ， 用 于 追踪 与 Players 集合 所 有 相关 操作 的 状态 。 

以 下 是 Table 类 中 投注 和 有 牌 的 逻辑 处 理 的 相关 代码 。 


class Table: 
def init ( self ): 
self.deck = Deck() 
def Place bet( self, amount ): 
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print( "Bet", amount ) 
def get hand( self ) : 
try: 


self.hand= Hand2( d.pop(), d.pop(), d.pop() ) 
self.hole card= d.pop() 





except IndexError: 
# Out of cards: need to shuffle. 
self.deck= Deck () 
return self.get hand() 
print( "Deal", self.hand ) 
return self.hand 
def can insure( self, hand ) : 


return hand.dealer card.insure 
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Table 类 会 被 Player 类 调用 ， 从 而 接受 牌 局 、 创 建 Hand 对 象 ， 然 后 决定 手中 的 牌 是 否 为 保 
分 下 注 。 此 外 ， 还 需要 提供 一 些 可 以 被 Player 类 用 来 获取 牌 和 支付 的 函数 。 

在 get_hand() 函数 中 的 异常 处 理 部 分 , 并 没有 准确 的 模拟 玩 牌 时 的 真实 场景 。 这 可 能 会 导致 
统计 不 正确 。 更 好 的 模拟 方式 是 ， 在 牌 用 尽 的 情况 下 需要 新 建 一 副 牌 并 洗 牌 ， 而 不 是 抛 出 异常 。 

为 了 更 适当 地 交互 设计 并 模拟 真实 的 游戏 场景 ，Player 类 需要 一 个 下 注 策略 。 下 注 策略 
是 一 个 状态 对 象 ， 它 决定 了 初始 的 下 注 级 别 ， 通 常 当 每 局 游戏 输赢 之 后 可 以 再 次 选择 不 同 的 下 
注 策 略 。 
里 想 情况 下 ,希望 有 多 个 下 注 策略 对 象 。Python 中 有 一 个 模块 包含 了 很 多 装饰 器 ， 可 以 用 来 创 
建 抽象 基 类 。 一 种 非 正式 的 创建 策略 对 象 的 方式 是 在 基 类 函数 中 抛 出 异常 ， 用 以 标识 一 些 方法 必须 
在 子 类 中 提供 实现 。 

以 下 代码 包含 了 一 个 抽象 基 类 和 一 个 子 类 ， 用 来 定义 一 种 下 注 策略 。 






















































































































































































































































































































































































class BettingStrategy : 
def bet( self ) : 


raise NotIimplementedError( "No bet method" ) 
def record win( self ): 





pass 
def record loss( self ) : 
pass 


class Flat (BettingSstrategy): 
def bet( self ): 


return 1 



































基 类 中 定义 了 带 有 默认 返回 值 的 方法 。 抽 象 基 类 中 的 bet () 方法 抛 出 异常 ， 子 类 必须 给 
出 bet () 方 法 的 实现 。 其 他 方法 可 以 选择 是 否 使 用 基 类 的 默认 实现 。 前 面 给 出 的 游戏 策略 加 上 
这 个 下 注 策略 ， 可 以 模拟 出 Play 类 中 更 复杂 的 ”init _() 函数 的 使 用 场景 。 

我 们 可 以 使 用 abc 模块 来 丰富 抽象 基 类 的 实现 ， 如 以 下 代码 段 所 示 。 


import abc 










































































































































































class BettingSstrategy2 (metaclass=abc.ABCMeta): 
Qabstractmethod 
def bet( self ): 
return 1 
def record win( self ) : 
pass 
def record loss( self ): 
pass 





























它 有 两 个 好 处 : 首先 ， 它 阻止 了 对 抽象 基 类 Bettingstrategy2 的 实例 化 ， 其 次 任何 没有 提 
供 bet () 方法 实现 的 子 类 也 是 不 能 被 实例 化 的 。 如 果 我 们 试图 创建 一 个 类 的 实例 ， 而 这 个 类 并 没有 
提供 抽象 方法 的 实现 ， 程 序 就 会 抛 出 一 个 异常 。 


























































































































当然 如果 基 类 的 抽象 方法 提供 了 实现 ,那么 就 是 合法 的 ， 而 且 可 以 通过 super () .pet () 来 调用 。 











1.11 多 策略 的 _init__0 方 法 


有 些 对 象 的 创建 来 自 多 个 来 源 。 例 如 ， 我 们 也 许 需要 克隆 一 个 对 象 作为 备忘录 模式 的 一 部 分 ， 
或 者 冻结 一 个 对 象 以 使 它 可 以 用 来 作为 字典 的 键 或 放 入 哈 希 集合 ， 这 也 是 set 和 fronezenset 
类 的 实现 方式 。 

有 很 多 全 局 的 设计 模式 使 用 了 多 种 方式 来 创建 对 象 。 其 中 一 个 为 多 策略 初始 化 ， init _() 
函数 的 实现 逻辑 较为 复杂 ， 也 会 用 到 类 层次 结构 中 不 同 的 (静态 ) 构造 函数 。 

它们 是 非常 不 同 的 实现 方式 ， 在 接口 的 定义 上 就 有 根本 区 别 。 














































































































避免 克隆 方法 
在 Python 中 ,克隆 方法 是 很 少 用 到 的 ,因为 它 会 引入 不 必要 的 重 
复 对 象 . 使 用 克隆 或 许 意味 着 没有 正确 地 理解 Python 中 面向 对 象 


» 的 设计 原则 。 

Q 一 个 克隆 方法 为 对 象 创建 的 细节 做 了 不 必要 的 隐藏 ， 被 克隆 的 源 
对 象 无 法 知道 目标 对 象 的 结构 。 然 而 ， 如 果 源 对 象 提 供 了 可 读 性 
和 封装 都 良好 的 接口 ， 反 过 来 (目标 对 象 知 道 源 对 象 的 结构 ) 就 
是 可 以 接受 的 。 











之 前 的 例子 可 以 被 高 效 的 克隆 是 因为 它们 非常 简单 ， 在 下 一 章 中 会 进行 展开 描述 。 然 而 ， 为 了 
更 详细 地 说 明 更 多 关于 对 和 象 克隆 的 基本 技巧 , 我 们 会 讨论 一 下 如 何 把 可 变 的 Hand 对 象 冻 结 成 为 不 可 
变 的 Hang 对 象 。 
以 下 代码 演示 了 两 种 创建 Hand 对 象 的 例子 。 


class Hand3: 



























































def _init ( self, *args, **kw ): 

if lenl(largs) == 1 and isinstance (args[0],Hand3): 
# Clone an existing hand; often a bad idea 
other= args[0] 
self.dealer card= other.dealer card 
self.cards= other.cards 

else: 
# Build a fresh, new hand. 
dealer card, *cards = args 
self.dealer card= dealer card 
self.cards= list (cards) 








Wm 





第 1 种 方式 ，Hanqd3 实例 从 已 有 的 Hand3 对 象 创建 。 第 2 种 方式 ，Hand3 对 象 的 创建 基于 
Card 实例 。 


一 个 fronzenset 对 象 的 创建 可 以 基于 已 有 的 实例 ， 或 基于 已 存在 集合 对 象 。 下 一 章 会 具体 
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介绍 创建 不 可 变 对 象 。 基 于 已 有 的 Hand， 创建 一 个 Hand 对 象 ， 可 用 于 创建 一 个 Hand 对 象 的 备 在 3 
模式 ， 例 如 下 面 这 段 实现 。 


h = Hand( deck.pop(), deck.pop(), deck.pop() ) 






































memento= Hand( h ) 


我 们 使 用 memento 变量 来 保存 Hand 对 象 。 可 以 用 来 比较 当前 对 象 和 之 前 被 处 理 的 对 象 , 我 们 
也 可 以 冻结 它 用 于 集合 或 映射 。 


1.11.1 更 复杂 的 初始 化 方式 

为 了 将 多 策略 应 用 于 初始 化 ， 通 常 要 被 迫 放弃 显 式 命名 的 参数 。 这 样 的 设计 虽然 获得 了 灵活 性 ， 
却 使 得 参数 名 不 够 透明 ， 意 图 不 够 明显 ， 需 要 针对 不 同 的 使 用 场景 分 别提 供 文 档 进 行 解 释 说 明 。 
也 可 以 扩展 初始 化 的 实现 来 分 离 Hand 对 象 。 要 分 离 的 Hand 对 象 只 需 修 改 构造 函数 。 以 下 代 
但 段 演 示 了 如 何 分 离 一 个 Hand 对 象 。 


class Hand4 : 
































































































































def _init ( self, *args, **kw ) : 
if len(args) == 1 and isinstance (args[0],Hand4): 
# Clone an existing handl often a bad idea 
other= args[0] 





self.dealer card= other.dealer card 
self.cards= other.cards 
elif len(args) == 2 and isinstance(args[0],Hand4) and 'split" 
in kw: 
Split an existing hand 


# 

other, card= args 

self.dealer card= other.dealer card 
S 


elf.cards= [other.cards[kw['split']], card] 





elif len(args) == 3: 
# Build a fresh, new hand. 
dealer card, *cards = args 
self.dealer card= dealer card 
self.cards= list (cards) 

else: 
raise TypeError( "Invalid constructor args={0!r} 

kw={1!r}".format (args, kw) ) 
def _ str ( self ): 


return ", ".join( map(str, self.cards) ) 


这 个 设计 需要 传 入 更 多 的 纸牌 对 象 来 创建 合适 的 、 分 离 的 Hand 对 象 。 当 我 们 从 一 个 Hand4 
对 象 中 分 离 出 男 一 个 Hand4 对 象 时 ， 使 用 split 参数 作为 索引 从 原 Hand4 对 象 中 读 取 cardqd 对 象 。 
以 下 代码 演示 了 我 们 怎样 分 离 出 一 个 Hand 对 象 。 

Q = Deck() 

h = Hand4( d.pop(), d.pop(), d.pop() ) 


sl = Hand4( h, d.pop(), split=0 ) 
s2 = Hand4( h, d.pop(), split=1 ) 
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我 们 初始 化 了 






































_init_() 方 








init 


法 


一 个 Hand4 类 的 实例 然后 再 
将 Card 对 象 传 入 每 个 Hand 对 象 。 在 21 点 的 规则 
可 以 看 到 
多 个 像 fronzenset RR 然而 也 将 外 








() 函数 的 




















分 离 出 其 他 的 Hand4 实例 , 命名 为 sl 和 s2， 然后 
， 只 有 当 手 中 两 张 牌 大 小 相等 的 时 候 才 可 允许 
FE 常 复杂 ， 优 势 在 于 ， 它 可 以 基于 已 有 集合 同时 创建 
需要 更 多 的 注释 和 文档 来 说 明 这 些 行 为 。 
























































逻辑 已 经 
















































































































































































































































































1.11.2 静态 函数 的 初始 化 
当 我 们 有 多 种 方式 来 创建 一 个 对 象 时 ， 有 时 使 用 静态 函数 好 过 使 用 复杂 的 _init _() 函数 。 
也 可 以 考虑 使 用 类 函数 作为 初始 化 的 另 一 种 选择 ， 然 而 将 依赖 的 对 象 作为 参数 传 入 函数 会 更 
好 。 当 冻结 或 分 离 一 个 Hand 对 象 时 ， 我 们 或 许 希 望 创建 两 个 新 的 静态 函数 来 完成 任务 。 使 用 静态 
函数 作为 代理 构造 函数 在 语法 上 略 有 差别 ， 但 是 在 代码 的 组 织 上 却 有 明显 的 优势 。 
以 下 是 Hand 类 的 实现 , 使 用 了 静态 函数 来 完成 初始 化 , 从 已 有 的 Hana 实例 创建 两 个 新 实例 。 
class Hand5: 
def init ( self, dealer card, *cards ) : 
self.dealer card= dealer card 
self.cards = list(cards) 
Qstaticmethod 
def freeze( other ) : 
hand= Hand5( other.dealer card, *other.cards ) 
return hand 
Qstaticmethod 
def split( other, card0, cardl ) : 
hand0= Hand5( other.dealer card, other.cards[0], card0 ) 
handl= Hand5( other.dealer card, other.cards[1], cardl ) 
return hand0, handl 
def str ( self ): 
return ", ".join( map(str, self.cards) ) 
使 用 一 个 函数 完成 了 冻结 和 备忘录 模式 ， 用 另 一 个 函数 将 Hand5 对 象 分 离 为 两 个 子 实例 。 
这 样 既 可 以 增强 可 读 性 ， 也 不 必 使 用 参数 名 称 来 解释 接口 意图 。 
以 下 代码 段 演示 了 我 们 如 何 把 Hand5 对 象 进行 分 离 : 
d = Deck() 
h = Hand5( d.pop(), d.pop(), d.pop() ) 
sl, s2 = Hand5.split( h, d.pop(), d.pop() ) 
我 们 创建 了 一 个 Hand5 类 的 nh 实例 ， 把 它 分 为 另外 两 个 Hand 实例 ， 名 为 sl 和 s2， 然 后 分 
别 为 它们 赋值 。 而 使 用 _init _() 函数 实现 同样 的 功能 时 ，split () 静态 函数 的 实现 版 本 简化 了 很 
多 。 然 而 它 并 没有 遵守 一 个 原则 : 使 用 已 有 的 set 对 象 来 创建 fronzenset 对 象 。 
1.12 更 多 的 _init_ 0 技术 
我 们 再 来 看 一 下 其 他 一 些 更 高 级 的 _init _() 技 术 的 应 用 。 相 比 前 面 的 介绍 ， 它 们 的 应 用 场 
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景 不 是 特别 常见 。 
以 下 是 Player 类 的 定义 ,初始 化 使 用 了 两 个 策略 对 象 和 一 个 table 对 象 。 这 个 init _() 函数 看 起 
来 不 够 漂亮 。 


class Player: 





def _init ( self, table, bet strategy, game strategy ): 
self.bet strategy = bet strategy 
self.game strategy = game strategy 
self.table= table 
def game( self ) : 
self.table.place bet( self.bet strategy.bet() ) 
self.hand= self.table.get hand() 
if self.table.can insure( self.hand ) : 
if self.game strategy.insurance( self.hand ) : 
self.table.insure( self.bet strategy.bet() ) 
# Yet more... Elided for now 


Player 类 中 的 _init __() 函数 的 行为 似乎 仅仅 是 保存 对 象 。 代码 逻辑 只 是 把 参数 的 值 复制 到 


同样 名 称 的 变量 中 。 如 果 我 们 有 很 多 参数 ， 复 制 逻 辑 会 显得 腑 肿 且 重复 。 
我 们 可 以 像 如 下 代码 这 样 使 用 这 个 Player 类 (和 相关 对 象 )。 


table = Table() 

flat bet = Flat() 

dumb = GameStrategy () 

p = Player( table, flat bet, dumb ) 
p.game () 


我 们 可 以 通过 把 关键 字 参 数值 直接 转换 为 内 部 变量 ， 以 提供 一 个 非常 短 而 且 灵 活 的 初始 化 方式 。 
以 下 是 一 种 使 用 关键 字 参 数值 来 创建 Player 类 的 方式 。 


class Player2: 

def init ( self, **kw ) : 
"""Must provide table, bet strategy, game strategy.""" 
self. dict .update( kw ) 

def game( self ) : 
self.table.place bet( self.bet strategy.bet() ) 
self.hand= self.table.get hand() 
if self.table.can insure( self.hand ): 



































































































































if self.game strategy.insurance( self.hand ) : 





self.table.insure( self.bet strategy.bet() ) 
# etc. 


为 了 换 来 简洁 的 代码 ， 这 种 实现 方式 牺牲 了 大 量 的 可 读 性 。 它 使 得 代码 意图 变 得 模糊 。 
既然 ”init __() 函数 缩减 到 了 一 行 ， 函 数 的 很 多 多 余 的 重复 逻辑 也 被 拿 掉 了 。 然 而 这 种 多 余 也 


被 转化 为 对 象 各 自 的 构造 函数 表达 式 。 既 然 我 们 不 再 使 用 位 置 参数 ， 那 么 我 们 就 需要 为 对 象 初始 化 
表达 式 提 供 参 数 名 ， 如 以 下 代码 段 所 示 。 
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p2 = Player2( table=table, bet strategy=flat bet, game strategy=dumb ) 
为 什么 这 样 做 ? 
这 样 的 类 设计 非常 容易 扩展 ， 我 们 几乎 不 用 担心 是 否 需要 传 入 额外 的 参数 给 构造 函数 。 
以 下 是 调用 的 例子 。 


>>> pl= Player2( table=table, bet strategy=flat bet, game _ 
strategy=dumb) 











>>>p1l .game () 
以 下 代码 演示 了 这 个 设计 带 来 的 可 扩展 性 。 


>>> p2= Player2( table=table, bet strategy=flat bet, game_ 
strategy=dumb, log name="Flat/Dumb" ) 














>>>p2 .game () 


我 们 添加 了 一 个 1og_name 属性 而 并 不 需要 修改 类 定义 ， 这 个 属性 或 许可 以 用 来 进行 统计 分 
析 。Player2.1og_name 属性 可 以 用 于 日 志 的 注解 或 其 他 数据 。 

这 里 存在 一 个 限制 , 我 们 只 可 以 添加 类 内 部 不 会 发 生 冲 突 的 参数 名 。 在 创建 子 类 时 需要 了 解 类 
的 实现 ， 以 避免 关键 字 参 数 名 冲突 。 由 于 **kw 参数 提供 了 很 少 的 信息 ， 我 们 不 得 不 去 知道 它 的 实 
现 细节 。 可 在 大 多 数 情况 下 ， 我 们 要 相信 一 个 类 并 使 用 它 而 不 是 去 查看 它 的 实现 细节 。 

这 种 基于 关键 字 的 初始 化 可 以 放 在 基 类 中 实现 ， 以 简化 子 类 。 当 新 需求 导致 需要 添加 参数 时 ， 
我 们 不 必 在 每 个 子 类 中 都 实现 一 个 _init __() 函数 。 

这 种 实现 方式 的 弊端 在 于 存在 一 些 变量 在 子 类 中 没有 提供 文档 说 明 。 当 仅 需 要 添加 一 个 变量 
时 ， 可 能 需要 改变 整个 类 层次 结构 。 第 1 个 变量 添加 之 后 往往 还 会 需要 第 2 个 和 第 3 个 。 在 设计 的 
开始 ， 我 们 应 当 考 虑 设计 一 些 灵活 的 子 类 ， 而 不 是 完美 的 基 类 。 

我 们 可 以 《而 且 应 该 ) 像 下 面 代码 段 那样 同时 使 用 位 置 变 量 和 关键 字 变量 。 


class Player3( Player ) : 
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def _ init ( self, table, bet strategy game strategy, **extras 
小 有 
self.bet strategy = bet strategy 
self.game strategy = game strategy 
self.table= table 
self. dict .update( extras ) 


这 种 方式 看 起 来 比 完全 开放 的 定义 更 明智 。 我 们 把 必需 的 参数 设 为 位 置 参 数 ， 把 可 选 参数 通 
过 关键 字 参 数 传 入 。 这 也 演示 了 如 何 通过 extra 关键 字 参 数 把 可 选 参数 传 入 _init__() 函数 。 

这 样 的 灵活 性 ， 基 于 关键 字 的 初始 化 依赖 于 我 们 是 否 已 经 定义 了 相对 透明 的 类 。 这 种 实现 需要 
特别 关注 一 下 命名 ， 因 为 关键 字 参 数 名 是 开放 式 的 ， 要 避免 调试 过 程 中 发 生命 名 冲突 。 


1.12.1 带 有 类 型 验证 的 初始 化 
需要 类 型 验证 的 场景 很 少 。 从 某 种 程度 上 说 ， 这 是 对 Python 的 误解 。 从 概念 上 来 看 ， 类 型 验证 是 









































































































































1.12 更 多 的 _init 0 技术 27 





























为 了 验证 所 有 的 参数 类 型 是 恰当 的 类 型 ， 而 这 里 对 “恰当 ”的 定义 往往 作用 不 大 。 


这 和 验证 对 象 是 否 符合 其 他 标准 是 不 同 的 ， 例 如 数字 范围 

















查 和 防止 无 限 循环 。 





& 





在 init () 函数 中 实现 以 下 逻辑 可 能 会 带 来 问题 。 


class ValidPlayer: 








def _init ( self, table, bet strategy, game strategy ): 


assert isinstance( table, Table ) 
assert isinstance( bet strategy, BettingStrategy ) 
assert isinstance( game strategy, GameStrategy ) 


self.bet strategy = bet strategy 
self.game strategy = game strategy 
self.table= table 




















这 里 使 用 了 isinstance () 函数 检查 了 每 个 类 型 的 合法 性 。 






































































































































































































































































































































































































































































































































我 们 编写 了 玩 牌 游戏 模拟 器 并 通过 不 断 地 改变 GameStrategy 类 来 进行 实验 。 由 于 它们 都 很 
简单 “只 有 4 个 函数 )， 继 承 的 好 处 不 够 凸显 ， 我 们 可 以 单独 定义 每 个 子 类 而 不 再 定义 基 类 。 
正如 本 例 中 所 演示 的 ， 我 们 将 不 得 不 创建 子 类 ， 目 的 只 是 为 了 通过 初始 化 过 程 的 错误 检查 ， 而 
未 能 从 抽象 基 类 继承 到 任何 可 用 的 代码 。 
其 中 一 个 最 大 的 鸭子 类 型 问题 是 关于 数值 类 型 的 , 不 同 的 数值 类 型 会 在 不 同 的 上 下 文 工 作 。 试 
图 验证 参数 类 型 也 许 会 导致 原本 工作 很 好 的 一 个 数值 类 型 不 再 工作 。 当 试图 验证 时 ， 在 Python ， 
我 们 有 以 下 两 种 选择 。 
@ 为 不 是 很 广泛 的 集合 类 型 加 验证 。 代码 不 工作 了 我 们 将 会 知道 本 该 允许 使 用 的 类 型 被 
ll 
@ ”针对 相对 广泛 的 集合 类 型 ， 通常 不 考虑 加 验证 ,一 旦 代码 不 工作 了 我 们 将 会 知道 我 们 使 用 
了 一 个 不 允许 使 用 的 类 型 。 
这 两 点 基本 表达 了 相同 的 意思 。 代 码 某 一 天 可 能 会 无 效 ， 要 么 是 因为 一 个 本 该 多 许 的 类 型 被 禁 
止 了 ， 要 么 是 使 用 了 被 禁止 的 类 型 。 
yl 允许 任何 类 型 
一 般 在 Python 中 允许 使 用 任何 类 型 。 关 于 这 一 点 ， 在 第 4 章 “ 抽 
象 基 类 设计 的 一 致 性 ”中 会 再 次 回顾 。 
下 临 这 样 一 个 问题 : 为 什么 要 限制 未 来 潜在 的 使 用 场景 ? 
而 通常 没有 一 个 合理 的 理由 来 说 明 这 一 点 。 
为 了 不 为 以 后 的 应 用 场景 带 来 阻碍 ， 可 以 考虑 提供 文档 、 测 试 和 调试 日 志 来 帮助 其 他 程序 员 理 
解 哪 些 类 型 限制 是 可 以 被 处 理 的 。 为 了 使 工作 量 最 小 化 ， 无 论 如 何 我 们 都 必须 提供 文档 、 日 志和 测 
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不 兼 


_init_0 方 法 


以 下 是 一 段 示例 文档 ， 用 于 说 明 类 所 需 的 参数 。 


class Player: 
def _ init _ 


( self, table, 


bet strategy, game strategy ): 


"""Creates a new player associated with a table, 


and configured with proper betting and play strategies 


:param table: 
:param bet strategy: 
:param game strategy: 


worn 


an instance of 


an instance of 


self.bet strategy = bet strategy 


self.game strategy = game strategy 
self.table= table 








| 


使 ) 





这 个 类 时 ， 就 会 从 文档 得 知 类 的 参数 需求 。 











容 ， 那 么 代码 将 会 不 工作 。 理 想必 






































(unittest) 来 发 现 这 些 异 常 的 场景 。 


1.12.2 初始化、 封装 和 私有 化 
关于 Python 中 的 私有 化 可 以 概括 为 : 


数 或 


这 类 i 
经 常 被 错误 使 用 ， 为 子 类 的 定义 带 
的 概念 很 简单 ， 如 下 所 示 。 
@ 基本 都 是 公有 。 源 代码 
@ 传统 上 ， 我 们 会 使 用 


的 方式 。 这 些 内 部 集合 的 命名 方式 
义 一 个 “超级 私有 ”的 属性 或 函数 。 如 果 ; 


Python 发 布 并 使 用 了 同样 命名 的 函数 或 












































人 。 


EF 


大 家 都 是 成 名 





:class: 


可 以 传 入 任何 类 型 。 如 果 类 型 和 期 望 的 类 型 
4 况 下 ， 我 们 会 使 用 文 


面向 对 象 设计 使 得 接口 和 实现 有 了 很 大 的 差别 ， 这 也 是 封装 的 意义 。 一 个 类 封装 了 一 种 数据 结 


an instance of :class:'Table' 


"BettingStrategy 


:ClLass:'GameStrategy' 
































档 测 试 (qoctest ) 和 单元 测试 























个 算法 和 一 个 外 部 接口 等 ， 
然而 ， 没 有 编程 语言 
关于 类 设计 的 一 个 方面 ， 这 一 点 没有 用 代码 演 







































































看 言 中 的 访问 修 























多 饰 符 包 括 了 私有 、 
































Python 中 私有 















































Python 中 的 部 分 函数 以 _ 
用 像 Sphinx 这 样 的 工 
























































随时 可 修改 ， 大 家 都 是 成 年 人 
命名 来 表明 哪些 不 是 完全 公有 的 。 
节 ， 然 而 并 不 存在 正式 的 、 概 念 上 的 私有 。 
命名 ， 标 记 为 不 完全 公有 。help 
具 从 文档 中 查找 出 它们 的 命名 。 























Python 的 内 部 命名 以 ”起 始 (和 结尾 )。 这 也 是 Python 如 
































他 名 称 发 生 冲 突 。 

















Python 中 关 








这 样 做 的 话 就 为 以 后 





于 可 见 度 的 命名 规则 如 下 所 示 。 


星 序 设计 的 目的 是 要 把 接口 与 实现 分 离 。 
会 暴露 出 所 有 设计 的 细节 。 对 于 Python， 也 是 如 此 。 
示 : 对 象 中 有 关 私 有 【实现 ) 和 公有 《接口 ) 函 


























>» 


() 




















属性 的 差异 。 有 些 编 程 语言 只 是 在 概念 上 支持 私有 〈C++ 或 Java 是 两 个 例子 ) 已 经 很 复杂 了 。 
呆 护 、 公 有 和 “未 指定 ”， 
来 了 没 必要 的 复杂 性 。 














可 以 理解 为 半 私 有 。 私 有 关键 字 











没有 什么 是 可 以 真正 被 隐藏 的 。 
它们 通常 是 容易 变化 的 具体 实现 名 















































小 
这 
胎 
议 
头 
以 
深 
马 
= 
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函数 通常 





可 








制造 
属性 时 ， 就 会 有 命名 冲 














避免 内 部 和 外 部 应 用 程序 发 生 冲突 
完全 只 是 参考 。 毕 竞 ， 没 有 必要 在 代码 中 试图 使 用 前 缀 来 定 


























了 一 个 潜在 的 麻烦 ， 当 新 版 本 的 
突 。 我 们 还 有 可 能 和 新 版 本 中 的 其 



































大 部 分 名 称 是 公有 的 。 


以 _ 开 始 的 名 字 通 常 不 完全 公有 。 使 用 它们 来 命名 那些 经 常 变化 的 函数 ， 这 些 函数 通常 是 
实现 细节 。 






























































@ ”以 _ 作 为 前 级 和 后 级 的 函数 通常 是 Python 内 部 的 。 程 序 中 不 该 使 用 ; 命名 要 参考 编程 语 
言 的 定义 。 

通常 ，Python 中 的 命名 是 根据 函数 (或 属性 ) 的 目的 来 定义 的 ， 并 提供 文档 说 明 。 通 常 接口 函 

数 会 有 说 明文 档 以 及 文档 测试 的 例子 ， 而 实现 细节 的 函数 就 不 必 了 ， 提 供 简 单 的 说 明 就 可 以 了 。 

对 于 刚 接触 Python 的 程序 员 , 有 时 会 对 私有 化 不 是 很 常用 而 感到 惊讶 。 可 对 于 已 经 熟悉 Python 

的 程序 员 也 会 同样 惊讶 于 ,为 了 不 必要 的 私有 和 公有 定义 的 顺序 而 浪费 很 多 脑 细 胞 。 因 为 函数 名 和 

文档 已 经 把 意图 描述 的 很 明白 了 。 











































































































































































































1.13 总 结 


























在 本 章 中 , 我 们 回顾 了 几 种 init _() 函数 的 设计 方法 。 在 下 一 章 中 ,我 们 会 介绍 特殊 方法 ， 
包括 一 些 高 级 的 方法 。 








第 2 章 


与 Python 无 缝 集成 一 一 基本 





特殊 方法 


Python 中 有 一 些 特殊 方法 ， 它 们 允许 我 们 的 类 和 Python 更 好 地 集成 。 在 标准 库 参 考 (Standard 


Library Reference) 中， 它们 被 称 为 基本 特殊 方法 ， 是 与 Python 的 其 


例如 ， 我们 | 






































的 一 个 或 两 个 。 












































我 们 还 会 介绍 其 他 的 转换 方法 ， 尤 其 是 _hash 
法 可 以 把 一 个 对 象 转换 成 一 个 数字 、 一 个 布尔 值 或 者 一 串 字 节 。 例 如 





























也 特性 无 颖 集成 的 基础 。 





字符 串 来 表示 一 个 对 象 的 值 。ob ject 基 类 包含 了 _repr_() 和 str _() 的 默认 实 








()、 











现 ， 它 们 提供 了 一 个 对 象 的 字符 串 描述 。 遗 憾 的 是 ， 这 些 默认 的 实现 不 够 详细 。 我 们 几乎 总 会 想 重 写 它们 
我 们 还 会 介绍 format () ， 它 更 加 复杂 一 些 , 1 




















晶 是 和 上 面 两 个 方法 的 作用 相同 。 

















bool 





() 和 bytes ()。 这 些 方 








我 们 就 可 以 像 下 对 
接 下 来 ， 我 


ne __()、 g 














t _() 和 _ge _()。 








当 我 们 定义 一 个 类 时 ， 几 乎 总 是 需要 使 ) 



































我 们 会 在 最 后 介绍 new _() 和 del 




















殊 方 法 ， 我 们 并 





不 会 经 常 使 用 它们 。 





我 们 会 详 名 
































承 而 来 的 默认 行为 ， 这 检 





() ， 














大 | 








j 这 些 基 本 的 特殊 方法 。 
为 它们 的 使 





2.1 _ repr (0 和 str 0 方法 


对 于 一 个 对 





@ 通常 ,stz () 方 法 表示 的 对 象 对 用 户 更 加 友好 。 这 个 方法 是 


























焉 芭 


， 当 我 们 实现 了 __bool__()， 
这 样 在 i£ 语句 中 使 用 我 们 的 对 象 : if someobject:。 
门 会 介绍 实现 了 比较 运算 符 的 几 个 特殊 方法 : 


()、_ Je ()、_ eq ()、 









































更 加 复杂 ,而 且 相 比 于 其 他 的 特 











| 地 介绍 如 何 用 这 些 特殊 方法 来 扩展 一 个 简单 类 。 我 们 需要 了 解 从 ob ject 继 




















FE， 我 们 才能 理解 应 该 在 什么 时 候 使 用 重 写 ， 以 及 如 何 使 用 它 。 


象 ，Python 提供 了 两 种 字符 串 表 示 。 它 们 和 内 建 函 数 repr ()、str()、print () 
及 string.format () 的 功能 是 一 致 的 。 





















































@ repr () 方 法 的 表示 通常 会 更 加 技术 化 ， 














pr 














对 象 的 _str 方法 实现 的 。 




















可 能 是 


个 完整 








的 Python 表达 式 。 文 档 中 写 道 : 






















































































































































































str_() 方 法 31 









































!s} 格 式 时 ， 我 们 





2;1 repr _() 和 和 
对 于 大 多 数 类 型 ， 这 个 方法 会 尝试 给 出 和 调用 eval () 一 样 的 结果 。 
这 个 方法 是 由 _repr _() 方 法 实现 的 。 
@ print () 函数 会 调用 str () 来 生成 要 输出 的 对 象 。 
@ 字符 串 的 format () 函数 也 可 以 使 用 这 些 方法 。 当 我 们 使 用 { !r} 或 者 { 
实际 上 分 别 调用 了 _repr () 或 者 _str _() 方 法 。 
下 面 我 们 先 来 看 一 下 这 些 方法 的 默认 实现 。 
下 面 是 一 个 很 简单 的 类 。 
class Card: 
insure= False 
def init ( self, rank, suit ) : 
self.suit= suit 
self.rank= rank 
self.hard, self.soft = self. points() 
class NumberCard( Card ) : 
def points( self ): 
return int (self.rank), int (self.rank) 
我 们 定义 了 两 个 简单 类 ， 每 个 类 包含 4 个 属性 。 
下 面 是 在 命令 行 中 使 用 Numbercard 类 的 结果 。 
>>> x=NumberCard( '2', '®%') 
>>>str (x) 
'<_ main .NumberCard object at 0x1013ea610>"' 
>>>repr (x) 
'< main .NumberCard object at 0x1013ea610>"' 
>>>print (x) 
< main .NumberCard object at Oxl013ea610> 
可 以 看 到 ,， str _() 和 _repr 常 有 用 的 信息 。 
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在 以 下 两 种 情况 下 ， 我 们 可 以 考虑 () 和 
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str 














) 的 默认 实现 并 不 能 提供 非 


repr 
































() 。 





























@ 非 集合 对 象 : 一 个 不 包括 任何 其 他 集合 对 象 的 “简单 ”对 象 ， 这 类 对 象 
特别 复杂 。 
@ 集合 对 象 : 一 个 包含 集合 的 对 象 ， 这 类 对 象 的 格式 化 会 更 为 复杂 。 











2.1.1 非 集合 对 象 的 _str_0 和 repr_0 



















































































的 格式 化 通常 不 会 

















正如 我 们 在 前 面 看 到 的 ， str () 和 ”repr () 并 没有 提供 有 用 的 信息 ， 我 们 几乎 总 是 需 
要 重 载 它们 。 下 面 是 当 对 象 中 不 包括 集合 时 我 们 可 以 使 用 的 一 种 方法 。 这 些 方法 是 我 们 前 面 定 义 的 
Card 类 的 方法 。 
def-. -Teper ,SeLfE. .Ss 
return "{ _ class name } (suit={suit!r}, rank={rank!r})". 





format ( 
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class =self. Cclass , **self. dict ) 
def _ str ( self ): 
return "{rank}{suit}".format (**self. dict ) 


这 两 个 方法 依赖 于 如 何 将 对 象 的 内 部 实例 变量 _qict ”传递 给 format () 函数 。 这 种 方式 对 于 
使 用 _slots 的 函数 并 不 合适 ,通常 来 说 ， 这 些 都 是 不 可 变 的 对 象 。 在 格式 规范 中 使 用 名 字 可 以 
让 格式 化 更 加 可 读 ， 不 过 它 也 让 格式 化 模板 更 长 。 以 ”repr () 为 例 ， 我 们 传递 了 qict 和 
_class 作为 format () 函数 的 参数 。 

格式 化 模板 使 用 了 两 种 格式 化 的 规范 。 

@ { class . name _} 模 板 ， 有 时 候 也 被 写成 {_class . name !s},， 提供 了 类 

名 的 简单 字符 串 表 示 。 

@ {suit!r} 和 {rank!r} 模 板 ， 它 们 都 使 用 了 !r 格式 规范 来 给 repr () 方法 提供 属性 值 。 

以 _str _() 为 例 ， 我们 只 传递 了 对 象 的 _qdict ， 而 内 部 则 是 隐 式 使 用 了 {1s} 格 式 规范 来 
提供 str() 方 法 的 属性 值 。 


2.1.2 集合 中 的 _str_ 0 和 _repr_0 


涉及 集合 的 时 候 ， 我 们 需要 格式 化 集合 中 的 单个 对 象 以 及 这 些 对 象 的 整体 容器 。 下 面 是 一 个 包 
str _() 和 repr () 的 简单 集合 。 


























































































































































































































n> 














class Hand: 

def jinit ( self, dealer card, *cards ) : 
self.dealer card= dealer card 
self.cards= list (cards) 

def str ( self ): 
return "“, ".join( map(str, self.cards) ) 

def _repr ( self ): 
return "{ class . name }({dealer cardlr}, {_ cards str})". 





format ( 
class =self. class , 





_Ccards str=", ".join( map(repr, self.cards) ), 
*xXSelf, dict  ) 














过 








__str () 方 法 很 简单 。 
1. 调用 map 函数 对 集合 中 的 每 个 对 象 使 用 str () 方法 ， 这 会 基于 返回 的 字符 串 集合 创建 一 个 
迭代 器 。 

2.， 用 "，,". join () 将 所 有 对 象 的 字符 串 表 示 连 接 成 一 个 长 字符 串 。 
__repr () 方 法 更 加 复杂 。 
l. j map 函数 对 集合 中 的 每 个 对 象 应 用 repr () 方法 ， 这 会 基于 返回 的 结果 集 创建 一 个 迭代 器 。 
2. 使 用 ".". join () 连接 所 有 对 象 的 字符 串 表示 。 

3， 用 _class 、 集 合 字符 串 和 ”qict 中 的 不 同属 性 创建 一 些 关键 字 。 我 们 将 集合 字符 


命名 为 carg str， 这 样 就 不 会 和 现 有 的 属性 冲突 。 
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mie 



































[= 
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4. 用 "{ class . name 








和 之 前 连接 的 对 象 字符 虽 





2.2 format (0) 方 法 “33 


}({dealer card!r}, {_cards str})".format 个 来 连接 类 名 























在 一 些 情况 下 ,我 们 可 以 优化 这 个 过 程 ， 





程度 上 简化 模板 字符 串 。 


 。 我 们 使 用 














2.2 format (方法 














!r 格式 化 来 保证 属性 也 会 使 用 repr () 来 转换 。 
让 它 更 加 简单 。 在 格式 化 中 使 用 位 置 参 数 可 以 在 一 定 


















































string.format () 和 内 置 的 format () 函数 都 使 用 了 format _() 方 法 。 它们 都 是 为 了 获 





























得 给 定 对 象 的 一 个 符合 要 求 的 字符 串 表 示 。 











下 面 是 给 ”format _() 传 参 的 两 种 方式 。 


@®@ someobject. forma 





tC ) : 





当 应 用 程序 中 出 现 format (someobject) 或 者 





























"{0}".format (someobject) 时, 会 默认 以 这 种 方式 调用 format ()。 在 这 些 情况 下 ， 
会 传递 一 个 空 字 符 串 ， format _() 的 返回 值 会 以 默认 格式 表示 。 















































@ someobject. format (specification) : 当 应 用 程序 : 出 现 format (someobject, 


specification) 或 者 "{0:specification}".format (someobject)" 时 ， 会 默 























认 以 这 种 方式 调用 format _ ()。 











注意 ，"{0!1r}".format () 和"{0!s}".format() 并 不 会 调 


























format _() 方 法。 它们 会 





直接 调用 repr () 或 者 str 


()。 


























字符 串 表 示 形 式 提 供 了 明确 的 一 致 性 。 























是 应 用 在 项 目 0 上 的 格式 规范 。 
































当 specification 是 "" 时 ， 一 种 合理 的 返回 值 是 return str (self)， 这 为 各 种 对 象 的 

















在 一 个 格式 化 字符 串 中 ，" : "之 后 的 文本 都 | 





而 


于 格式 规范 。 当 我 们 写 "{0:06.4f}" 时 ，06.4f 





Python 标准 库 的 6.1.3.1 节 定 义 了 一 个 复杂 的 数值 规范 ， 它 是 一 个 包括 9 个 部 分 的 字符 串 。 这 就 
是 格式 规范 的 基本 语法 ， 它 的 语法 如 下 。 


























[[£ill]jalign] [sign] [#] [0] [width][,][.precision] [type] 


这 些 规范 的 正则 表示 如 下 。 








re.compilel 

r"(?P<fill align>.?[\<\>=\^])?" 

(?P<sign> [-+ ])?" 

(?P<alt>#)?" 
(2P<padding>0)?" 

"(?P<width>\d*)" 
( 
( 
( 


"(?P<comma>,)?" 


"(?P<precision>\.\d*)?" 


?P<type> [bcdeEfFgGnosxX$])?" ) 

















这 个 正则 表达 式 将 规范 分 解 为 8 个 部 分 。 第 1 部 分 同时 包括 了 原本 规范 中 的 fi11 和 alignment 
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字段 。 我 们 可 以 利用 它们 定义 我 们 的 类 中 的 数值 类 型 的 格式 。 

但 是 ，Python 格式 规范 的 语法 有 可 能 不 能 很 好 地 应 用 到 我 们 之 前 定义 的 类 上 。 所 以 ， 我 们 可 能 需要 
定义 我 们 自己 的 规范 化 语法 ， 并 且 使 用 我 们 自己 的 _format _() 方法 来 处 理 它 。 如 果 我 们 定义 的 是 数值 
类 型 ， 那 么 我 们 应 该 使 用 Python 中 内 建 的 语法 。 但 是 ， 对 于 其 他 类 型 ， 没 有 理由 坚持 使 用 预定 义 的 语法 。 

例如 , 下 面 是 我 们 自 定 义 的 一 个 微型 语言 ,用 sz 来 表示 rank, 用 ss 来 表示 suit, 用 #% 代 蔡 %g%， 
所 有 其 他 的 文本 保持 不 变 。 

我 们 可 以 用 下 面 的 格式 化 方法 扩展 card 类 。 


def format ( self, format spec ): 
if format spec == "": 



















































































































































































return str(self) 
rs= format spec.replace("%r",self.rank) .replace("%s",self.suit) 
rs= rs.replace ("%%","%") 
return rs 














方法 签名 中 ， 需 要 一 个 format_spec 作为 格式 规范 参数 。 如 果 没 有 提供 这 个 参数 ， 那 么 就 会 
使 用 str () 函数 来 返回 结果 。 如 果 提 供 了 格式 规范 参数 ， 就 会 用 rank、suit 和 s 字 符 蔡 换 规范 中 
对 应 的 部 分 ， 来 生成 最 后 的 结果 。 
这 人 允许 我 们 使 用 下 面 的 方法 来 格式 化 牌 。 


print( "Dealer Has {0:%r of ss}" .format ( hand.dealer card) ) 



























































































































































其 中 ， ("ms$r of $s") 作 为 格式 化 参数 传 入 format () 方 法 。 通 过 这 种 方式 ， 我 们 能 够 为 
苗 述 自 定义 对 象 提 供 统 一 的 接口 。 
或 者 ， 我 们 可 以 用 下 面 的 方法 : 



































default format= "some Specification" 
def str ( self ): 
return self. format ( self.default format ) 
def format ( self, format spec ): 
if format _ spec == "": format spec = self.default format 


# process the format specification. 


这 种 方法 的 优点 是 把 所 有 与 字符 串 表示 相关 的 钦 辑 放 在 ”format _() 方法 中 ， 而 不 是 分 别 写 在 
format () 和 str () 里 。 但 是 ， 这 样 做 有 一 个 缺点 ， 因 为 并 非 每 次 都 需要 实现 format _ () 
方法 ， 但 是 我 们 总 是 需要 实现 _str __()。 


2.2.1 内 欧 格 式 规范 


string.format () 方 法 可 以 处 理 {} 中 内 和 嵌 的 实例 ， 蔡 换 其 中 的 关键 字 ， 生 成 新 的 格式 规范 。 
这 种 替换 是 为 了 生成 最 后 传 入 _format _() 中 的 格式 化 字符 串 。 通 过 使 用 这 种 内 嵌 的 替换 ， 我 们 
可 以 使 用 一 种 更 加 简单 的 带 参数 的 更 加 通用 的 格式 规范 ， 而 不 是 使 用 相对 复杂 的 数值 格式 。 

下 面 是 使 用 内 骨 格 式 规范 的 一 个 例子 ， 它 让 format 参数 中 的 wigtn 更 容易 改变 : 
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width=6 
for hand,count in statistics.items(): 
print( "{hand}{count: {width}d}".format (hand=hand, count=count,width= width) ) 














我 们 定义 了 一 个 通用 的 格式 ，" {hand} {count: {width}d}"， 它 需要 一 个 width 参数 , 才 
算是 一 个 正确 的 格式 规范 。 
通过 wigqth= 参 数 提供 的 值 会 被 用 来 替换 {wigth}。 蔡 换 完成 后 ,完整 的 格式 化 字符 串 会 作为 
_ format () 方 法 的 参数 使 用 。 


2.2.2 ”集合 和 委托 格式 规范 


当 格 式 化 一 个 包含 集合 的 对 象 时 ， 我 们 有 两 个 难题 : 如 何 格式 化 整个 对 象 和 如 何 格式 化 集合 中 
的 对 象 。 以 Hand 为 例 ， 其 中 包含 了 cards 类 的 集合 。 我 们 会 更 希望 可 以 将 Hand 中 一 部 分 格式 化 
的 逻辑 委托 给 card 实例 完成 。 

下 面 是 Hand 中 的 ”format _() 方 法 。 

















































































































def _ format ( self, format specification ) : 





if format specification == "": 
return str(self) 

return ", ".join( "{0:{fs}}".format(c, fs=format specification) 
for c in self.cards ) 

















Hand 集合 中 的 每 个 carq 实例 都 会 使 用 format_specification 参数 。 对 于 每 一 个 Card 
对 象 ， 都 会 使 用 内 髓 格式 规范 的 方法 ， 用 format_specification 创建 基于 "{0:1{fs}}" 的 格 
式 。 通 过 这 样 的 方法 ， 一 个 Hand 对 象 player_ hand， 可 以 以 下 面 的 方法 格式 化 : 


"Player: {handq:Ss5rgss}" .format (hand=player hand) 


这 会 将 $rss 格式 规范 应 用 在 Hand 对 象 中 的 每 个 card 实例 上 。 


2.3 ”hash 0 方法 






























































内 置 的 hash () 函数 默认 调用 了 _hash _() 方 法 。 哈 希 是 一 种 将 相对 复杂 的 值 简化 为 小 整数 的 
计算 方式 。 理 论 上 说 ， 一 个 哈 希 值 可 以 表示 出 源 值 的 所 有 位 。 还 有 一 些 其 他 的 哈 希 方法 ， 会 得 出 非 
常 大 的 值 ， 这 样 的 算法 通常 用 于 密码 学 。 

Python 中 有 两 个 哈 希 库 。 其 中 ，hashlib 可 以 提供 密码 级 别 的 哈 希 函数 ，zlip 模块 包含 两 
个 高 效 的 哈 希 函数 : adler32 () 和 crc32 () 。 对 于 相对 简单 的 值 ， 我 们 不 使 用 这 些 内 置 的 函数 ， 
对 于 复杂 的 或 者 很 大 的 值 ， 这 些 内 置 的 函数 可 以 提供 很 大 的 帮助 。 

hash () 函数 (以 及 与 其 相关 联 的 _hashn _() 方 法 ) 主要 被 用 来 创建 set、frozenset 和 qict 
这 些 集 合 类 型 的 键 。 这 些 集合 利用 不 可 变 对 象 的 哈 希 值 来 高 效 地 查找 集合 中 的 对 象 。 

在 这 里 ， 不 可 变性 是 非常 重要 的 ， 我 们 还 会 多 次 提 到 它 。 不 可 变 对 象 不 会 改变 自己 的 状态 。 例 
如 ， 数 字 3 不 会 改变 状态 ， 它 永远 是 3。 对 于 更 复杂 的 对 象 ， 同 样 可 以 有 一 个 不 变 的 状态 。Python 
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AS 

















的 string 是 不 可 变 的 ， 所 以 它 介 
object 中 默认 的 _hash 
以 用 id () 函数 查看 : 


>>> x = object () 
>>>hash (x) 











































































































本 特殊 方法 

















] 可 以 被 ) 


























































































































] 作 map 和 set 的 键 。 
() 方 法 的 实现 是 基于 对 象 内 部 的 ID 值 


月 





成 哈 希 值 。 这 个 ID 值 可 
































































































































































































































































































































































































































































































































269741571 
>>>1d {x) 
4315865136 
>>>id(x) / 16 
269741571.0 
可 以 看 到 ， 在 笔者 的 系统 中 ， 哈 希 值 是 用 对 象 的 id 除 以 16 算出 来 的 。 对 于 不 同 的 平台 ， 哈 
值 的 计算 方法 有 可 能 不 同 。 例 如 ，CPython 使 用 portable c 库 ， 而 Jython 则 基于 JVM。 
这 里 最 关键 的 是 ， 在 _hash _() 和 内 部 的 ID 之 间 有 很 强 的 依赖 关系 。_hash__() 方法 默认 
的 行为 是 要 保证 每 一 个 对 象 都 是 可 哈 希 的 ， 并 且 哈 希 值 是 唯一 的 ， 即 使 这 些 对 象 包含 同样 的 值 。 
如 果 我 们 希望 包含 同样 值 的 不 同 对 象 有 相同 的 哈 希 值 ， 就 需要 修改 这 个 方法 。 在 下 一 节 中 ,我 
们 会 展示 一 个 例子 ， 这 个 例子 中 ， 具 有 相同 值 的 两 个 cardq 实例 被 当 作 相同 的 对 象 。 
2.3.1 决定 哈 希 的 对 象 
并 非 每 个 对 象 都 需要 提供 一 个 哈 希 值 ， 尤 其 是 ， 当 我 们 创建 一 个 包含 有 状态 、 可 改变 对 象 的 类 
时 ， 这 个 类 不 应 该 返回 哈 希 值 。 hash 的 定义 应 该 是 None。 
另外 ， 对 于 不 可 变 的 对 象 ， 可 以 显 式 地 返回 一 个 哈 希 值 ， 这 样 这 个 对 象 就 可 以 用 作 字 典 中 的 
个 键 或 者 集合 中 的 一 个 成 员 。 在 这 种 情况 下 ， 和 需要 和 相等 性 判断 的 实现 方式 兼容 。 相 同 的 对 
象 返回 不 同 的 哈 希 值 是 很 糟糕 的 实践 。 反 之 ， 具 有 相同 哈 希 值 的 对 象 互相 不 等 是 可 以 接受 的 。 
我 们 将 在 比较 运算 符 一 章 中 讲解 的 _eq __() 方 法 也 和 哈 希 有 紧密 的 关联 。 
等 价 性 比较 有 3 个 层次 。 
@ 了 哈 希 值 相 等 : 这 意味 两 个 对 象 可 能 相等 。 哈 希 值 是 判断 两 个 对 象 有 可 能 相等 的 快捷 方式 。 
如 果 哈 希 值 不 同 ， 两 个 对 象 不 可 能 相等 ， 也 不 可 能 是 同一 个 对 象 。 
@ 比较 结果 相等 : 这 意味 着 两 个 对 象 的 哈 希 值 已 经 是 相等 的 ， 这 个 比较 用 的 是 == 运 算 符 。 如 
果 结 果 相 等 ， 那 么 两 个 对 象 有 可 能 是 同一 个 。 
@ IDD 相等 : 这 意味 着 两 个 对 象 是 同一 个 对 象 。 它 们 的 哈 希 值 相同 ， 使 用 == 的 比较 结果 
相等 ， 这 个 比较 用 的 是 is 运算 符 。 
基本 哈 希 法 (Fundamental Law of Hash，FLH) 定义 如 下 : 比较 相等 的 对 象 的 哈 希 值 一 定 相同 。 
我 们 可 以 认为 哈 希 比较 是 等 价 性 比较 的 第 1 步 
反之 则 不 成 立 ， 有 相同 哈 希 值 的 对 象 不 一 定 相 等 。 当 创建 集合 或 字典 时 ,这 带 来 了 == 预 期 的 处 
理 开 销 。 我 们 没有 办 法 从 更 大 的 数据 结构 中 可 靠 地 创建 64 位 不 同 的 哈 希 值 ， 这 时 就 会 出 现 不 同 的 
对 象 的 哈 希 值 碰巧 相等 的 情况 。 
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巧合 的 是 ， 当 使 用 sets 和 dicts 的 时 候 ， 计 算 哈 希 值 相等 是 预期 的 开销 。 这 些 集合 中 有 
些 内 置 的 算法 ， 当 哈 希 值 出 现 冲突 的 时 候 ， 它 们 会 使 用 备用 的 位 置 。 
对 于 以 下 3 种 情况 ， 需 要 使 用 _eq _() 和 hash () 方 法 来 定义 相等 性 测试 和 哈 希 值 。 
























































@ 不 可 变 对 象 : 这 些 是 不 可 以 修改 的 无 状态 类 型 对 象 ， 例 如 tuple、namedtuple 和 
frozenset。 我 们 针对 这 种 情况 有 两 个 选择 。 
4 不 用 自 定义 _hash _() 和 eq ()。 这 意味 着 直接 使 用 继承 而 来 的 行为 。 这 种 情况 
下 ， hash () 返回 一 个 简单 的 函数 代表 对 象 的 ID 值 ， 然 后 _eq _() 比较 对 象 的 
ID 值 .默认 相等 性 测试 的 行为 有 时 候 比 较 反 常 ,我 们 的 应 用 程序 可 能 会 需要 card (1, 
Clubs) 的 两 个 实例 来 测试 相等 性 和 计算 哈 希 值 ， 但 是 默认 情况 下 这 不 会 发 生 。 
4 ” 自 定 义 hash () 和 eq ()。 请 注意 ， 这 种 自 定义 必须 是 针对 不 可 变 对 象 。 
@ 可 变 对 象 : 这 些 都 是 有 状态 的 对 象 , 它们 允许 从 内 部 修改 。 设 计时 , 我 们 有 一 个 选择 如 下 。 
4 自 定 义 _eq ()， 但 是 设置 hash 为 None。 这 些 对 象 不 可 以 用 作 qict 的 键 和 
set 中 的 项 目 。 
除了 上 面 的 选择 之 外 ,还 有 一 种 可 能 的 组 合 : 自 定义 _hash _() 但 使 用 默认 的 _eq _()。 但 
是 ， 这 简直 是 浪费 代码 ， 因 为 默认 的 _eq _() 方 法 和 is 操作 符 是 等 价 的 。 对 于 相同 的 行为 ， 使 
用 默认 的 _hash _() 方 法 只 需要 写 更 少 的 代码 。 
接 下 来 ， 我 们 细致 地 分 析 一 下 以 上 3 种 选择 。 


2.3.2 ”有 关 不 可 变 对 象 和 继承 的 默认 行为 


首先 ， 我 们 来 看 看 默认 行为 是 如 何 工作 的 。 下 面 是 一 个 使 用 了 默认 hash () 和 _eqa () 
的 简单 类 。 


class Card: 
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insure= False 
def init ( self, rank, suit, hard, soft ) : 
self.rank= rank 
self.suit= suit 
self.hard= hard 
self.soft= soft 
def _ repr ( Self ): 
return "{ class . name }(suit={suit!r}, rank={rank!r})". 





format( class =self. class , **self. dict ) 
def _ str ( self ): 
return "{rank}{suit}".format (**self. dict ) 





class NumberCard( Card ) : 
def init ( self, rank, suit ): 
super(). init ( str(rank), suit, rank, rank ) 


class AceCard( Card ): 
def init ( self, rank, suit ): 
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Super (). init ( "A", suit, 1, 11 ) 
class FaceCard( Card ) : 


def init ( self, rank, suit ) : 
super(). init ( {11: 'J', 12: 'Q', 13: 'K' }[rank], suit, 10, 10 ) 


这 是 一 个 基本 的 不 可 变 对 象 的 类 结构 。 我 们 还 没有 实现 防止 属性 更 新 的 特殊 方法 。 我们 会 在 下 









































续 中 介绍 属性 访问 。 





例子 


们 对 


能 不 


接 下 来 ， 我 们 使 用 之 前 定义 的 类 。 


>>> cl = AceCard( 1, '®' ) 
>>> c2 = AceCard( 1, '®' ) 


我 们 定义 了 两 个 看 起 来 一 样 的 card 实例 。 我 们 可 以 用 下 面 的 代码 获得 ia () 的 值 。 


>>>print( id(c1), id(c2) ) 
4302577232 4302576976 


可 以 看 到 ， 它 们 的 id () 值 不 同 ， 说 明 它 们 是 两 个 不 同 的 对 象 。 这 正 是 我 们 期 望 的 行为 。 
我 们 还 可 以 用 is 运算 符 检 测 它们 是 否 相 同 。 


>>>Ccl1 is c2 

































































False 

“is 测试 ”基于 ia () 的 值 ， 它 表明 ， 这 两 个 对 象 确 实 是 不 同 的 。 

我 们 可 以 看 到 ， 它 们 的 哈 希 值 也 是 不 同 的 。 

>>>print( hash(c1l), hash(c2) ) 

268911077 268911061 

这 些 哈 希 值 是 根据 id () 的 值 计算 出 来 的 。 对 于 继承 的 方法 ， 这 正 是 我 们 期 望 的 行为 。 在 这 个 
， 我 们 可 以 用 下 面 的 代码 用 ia() 计算 出 哈 希 值 。 
>>>id(c1l) / 16 

268911077.0 


>>>id(c2) / 16 
268911061.0 


于 哈 希 值 不 同 ， 因 此 它们 比较 的 结果 肯定 不 同 。 这 符合 哈 希 和 相等 性 的 定义 。 但 是 ， 这 和 我 

















































































































































































































这 个 类 的 预期 不 同 。 下 面 是 一 个 相等 性 测试 。 

>>>print( cl == c2 ) 

False 

我 们 之 前 用 相等 的 参数 创建 了 这 两 个 对 象 ， 但 是 它们 不 相等 。 在 一 些 应 用 程序 中 ， 这 样 的 行为 可 













































































是 所 期 望 的 。 例 如 ， 当 统计 庄家 牌 的 点 数 时 ， 我 们 不 想 因 为 使 用 了 6 副 牌 而 把 同一 张 牌 统计 6 次 。 
可 以 看 到 ， 由 于 我 们 可 以 把 它们 存 入 set 中 ， 因 此 它们 一 定 是 不 可 变 对 象 。 


>>>print( set( [cl，c2] ) ) 
{AceCard (suit='®', rank=1), AceCard(suit='®', rank=1)} 
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这 是 标准 参考 库 中 记录 的 行为 。 默 认 地 ， 我 们 会 得 到 一 个 基于 对 象 ID 值 的 _hash () 方 法 ， 这 
样 每 一 个 实例 都 是 唯一 的 。 但 我 们 并 非 总 是 需要 这 样 的 行为 。 


2.3.3 ” 重 载 不 可 变 对 象 


下 面 是 一 个 重 载 了 _phasnh () 和 eq () 定义 的 简单 类 。 


class Card2: 












































insure= False 
def init ( self, rank, suit, hard, soft ) : 
self.rank= rank 
self.suit= suit 
self.hard= hard 
self.soft= soft 
def _ repr ( self ): 
return "{ class . name }(suit={suit!r}, rank={rank!r})". 
format( class =self. Cclass , **self. dict ) 
def str ( self ): 
return "{rank}{suit}".format (**self. dict ) 
def eq ( self, other ): 
return self.suit == other.suit and self.rank == other.rank 
def hash ( self ): 
return hash(self.suit) ^ hash(self.rank) 
class AceCard2( Card2 ): 
insure= True 











def init ( self, rank, suit ): 
super(). init ( "A", suit, 1, 11 ) 


原则 上 , 这 个 对 象 应 该 是 不 可 变 的 。 但 是 , 我 们 还 没有 引入 让 它 成 为 真正 的 不 可 变 对 象 的 机 制 。 
在 第 3 章 中 ， 我 们 会 探讨 如 何 防止 属性 值 被 改变 。 

同时 ， 请 注意 ， 上 述 代码 中 省 略 了 上 个 例子 中 的 两 个 子 类 ， 因 为 它们 的 代码 和 之 前 一 样 。 

_eq () 方 法 比较 了 两 个 初始 值 : suit 和 rank, 而 没有 比较 对 象 中 从 rank 继承 而 来 的 值 。 

21 点 的 规则 让 这 样 的 定义 看 起 来 有 些 奇怪 。 在 21 点 中 ，suit 并 不 重要 。 那 么 是 不 是 我 们 只 需 
要 比较 rank 就 可 以 了 ? 我 们 是 否 应 该 再 定义 一 个 方法 只 比较 rank? 或 者 ， 我 们 是 否 应 该 相信 应 用 
程序 可 以 用 合适 的 方式 比较 rank? 对 于 这 3 个 问题 ， 没 有 最 好 的 答案 ， 因 为 这 些 都 是 权宜 的 方法 。 

hash () 方法 函数 通过 对 两 个 基本 数字 的 所 有 位 取 异 或 计算 出 一 种 新 的 位 模式 。 用 ^ 运 算 符 是 另 
外 一 种 快速 但 不 好 的 方法 。 对 于 更 复杂 的 对 象 ， 最 好 能 使 用 更 合理 的 方法 。 在 开始 自己 造 轮 子 之 前 
可 以 先 看 看 ziplib。 

接 下 来 ， 我 们 看 看 这 些 类 的 对 象 是 如 何 工 作 的 。 我 们 预期 它们 是 等 价 的 ， 并 且 能 够 用 于 set 
和 dict 中 。 以 下 是 两 个 对 象 。 


>>> cl = AceCard2( 
>>> c2 = AceCard2( 


我 们 定义 了 两 个 看 起 来 似乎 相同 的 对 象 。 但 是 ， 通 过 查看 ID 的 值 ， 我 们 可 以 确保 它们 事实 上 
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是 不 同 的 。 


>>>print( id(c1l), id(c2) ) 
4302577040 4302577296 
Drine( “Ct. LS E27) 

False 


这 两 个 对 象 的 id () 返回 值 不 同 。 如果 用 is 运算 符 比 较 它们 , 可 以 看 到 ,它们 是 两 个 不 同 的 对 象 。 
接 下 来 ， 我 们 比较 它们 的 哈 希 值 。 


>>>print( hash(cl)，hash(c2) ) 
1259258073890 1259258073890 


可 以 看 到 ， 哈 希 值 是 相同 的 ， 也 就 是 说 它们 有 可 能 相等 。 
== 运 算 符 比较 的 结果 和 我 们 预期 的 一 样 ， 它 们 是 相等 的 。 







































































































































































>>>print( cl == c2 ) 
True 

于 这 两 个 都 是 不 可 变 的 对 象 ， 因 此 我 们 可 以 将 它们 放 进 set 里 。 
>>>print( set( [cl，c2] ) ) 


{AceCard2 (suit='®', rank='A')} 


对 于 复杂 的 不 可 变 对 象 ， 这 样 的 行为 和 我 们 预期 的 一 致 。 我 们 必须 同时 重 载 这 两 个 特殊 方法 来 
使 结果 一 致 并 且 有 意义 。 


2.3.4 重 载 可 变 对 象 


这 个 例子 会 继续 使 用 carqs 类 。 可 变 的 牌 听 起 来 有 些 奇 怪 ， 甚 至 是 错误 的 。 但 是 ， 我 们 只 会 
对 前 面 的 例子 做 一 个 小 改变 。 
下 面 的 类 层次 结构 中 ， 我 们 重 载 了 可 变 对 象 的 _hash () 和 _ eq ()。 


class Card3: 


















































insure= False 
def init ( self, rank, suit, hard, soft ) : 
self.rank= rank 
self.suit= suit 
self.hard= hard 
self.soft= soft 
def _ repr ( self ): 


return "{ class . name }(suit={suit!r}, rank={rank!r})". 





format( class =self. class , **self. dict ) 
def _ str ( self ): 
return "{rank}{suit}".format (**self. dict ) 





def eq ( self, other ): 


return self.suit == other.suit and self.rank == other.rank 
# and self.hard == other.hard and self.soft == other.soft 
_hash = None 


class AceCard3( Card3 ) : 


insure= True 


def init ( self, rank, suit ) : 


super () . 


Lint ("AV SUlty ly 11 ) 
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接 下 来 ， 让 我 们 看 看 这 些 类 对 象 的 行为 。 我 们 期 望 的 行为 是 ， 它 们 在 比较 中 是 相等 的 ， 但 是 
不 可 以 用 于 set 和 qict 。 我 们 创建 了 如 下 两 个 对 象 。 




















>>> cl = AceCard3 ( 


>>> c2 = AceCard3 ( 


我 们 再 次 定义 了 两 个 看 起 来 相同 的 牌 。 





1, '%'! ) 
1, '%'! ) 





























下 面 ， 我 们 看 看 它们 的 ID 值 ， 确 保 它们 实际 上 是 不 同 的 两 个 实例 。 





>>>print( id(c1), 

















id(c2) ) 


4302577040 4302577296 


和 我 们 预期 的 一 样 ， 它 们 的 ID 值 不 同 。 接 下 来 ， 让 我 们 看 看 是 否 可 以 获得 哈 希 值 。 





>>>PLint ( hash(c1) 


File "<stdin>", 


























; hash(c2 


line 1, i 


ypeError: unhashable type: 


丸 为 ”hash 被 设 为 None， 所 以 这 些 用 cargd3 生成 的 对 象 不 可 以 被 哈 希 ， 也 就 无 法 通过 





) ) 


Traceback (most recent call last): 


n <module> 
'AceCard3"' 





hash () 函数 提供 哈 希 值 了 。 这 正 是 我 们 预期 的 行为 。 
我 们 可 以 用 下 面 的 代码 比较 这 两 个 对 象 。 


>>>Print( cl == c2 ) 














True 





























比较 的 结果 和 我 们 预期 的 一 样 , 这 样 我 们 就 仍然 可 以 使 用 == 来 比较 它们 , 只 是 这 两 个 对 象 不 可 














以 存放 在 set 中 或 者 用 作 gict 的 键 。 
下 面 是 当 我 们 试图 将 这 两 个 对 象 插入 set 中 时 的 结果 。 





>>>print( set( [cl, c2] ) ) 


File "<stdin>", 

















很 明显 ， 对 于 生活 






































Traceback (most recent call last): 


line 1, in <module> 


TypeError: unhashable type: 


"AceCard3 





当 试 图 插入 set 中 时 ， 我 们 得 到 了 一 个 适当 的 异常 。 








的 一 些 不 可 








| 变 的 对 象 ， 例 如 一 张 牌 ， 这 样 的 定义 并 不 合适 。 这 种 定义 方式 









































更 适合 有 状态 的 对 象 ， 例 如 Hangd， 因 为 手中 的 牌 时 常 改变 。 下 面 的 部 分 ， 我 们 会 展示 第 2 个 有 状 


态 对 象 的 例子 。 














2.3.5 从 可 变 的 Hand 类 中 生成 一 个 不 可 变 的 Hand 类 


如 果 我 们 想 要 统计 特定 的 Hang 实例 ， 我 们 可 能 希望 创建 一 个 字 
一 个 可 变 的 Hand 类 作为 键 。 但 是 ， 我 们 可 以 模仿 set 和 














射 为 一 个 计数 。 在 映射 




















E， 然 后 将 一 个 Hang 实例 映 























， 不 能 使 
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frozenset 设计 ， 定 义 两 个 类 : Hand 和 FrozenHand。FrozenHand 人 允许 我 们 “冻结 ”一 个 Hand 
类 ， 冻 结 的 版 本 是 不 可 变 的 ， 所 以 可 以 作为 字典 的 键 。 
下 面 是 一 个 简单 的 Hand 定义 。 


class Hand: 
def init ( self, dealer card, *cards ) : 








self.dealer card= dealer card 
self.cards= list (cards) 
def str ( self ): 
return "“, ".join( map(str, self.cards) ) 
def _ repr ( self ): 
return "{ class . name }({dealer card!r}, {_cards str})".format( 





class =self. class , 





_Ccards str=", ".join( map(repr, self.cards) ), 
*xSelf. dict  ) 
Qe “eq "(Self ‘Other )s 
return self.cards == other.cards and self.dealer card == 


other.dealer card 





_hash = None 
这 是 一 个 包含 适当 的 相等 性 比较 的 可 变 对 象 ( hash 是 None)。 
下 面 是 不 可 变 的 Hand 版 本 。 


import sys 
class FrozenHand( Hand ) : 
def _init ( self, *args, **kw ): 
if lenl(largs) == 1 and isinstance (args[0], Hand): 

# Clone a hand 
other= args[0] 
self.dealer card= other.dealer card 
self.cards= other.cards 


else: 
# Build a fresh hand 
super(). init ( *args, **kw ) 
def hash ( self ): 
h= 0 
for c in self.cards: 
h= (h + hash(c)) % sys.hash info.modulus 


return h 
不 变 的 版 本 中 有 一 个 构造 函数 ， 从 男 外 一 个 Hang 类 创建 一 个 Hand 类 。 同 时 ， 还 定义 了 一 个 
_ hash _() 方 法 ， 用 sys .hash info.modulus 的 值 来 计算 cards 的 哈 希 值 。 大 多 数 情况 下 ， 这 
种 基于 模 计 算 复 合 对 象 哈 希 值 的 方法 能 够 满足 我 们 的 要 求 。 
现在 我 们 可 以 开始 使 用 这 些 类 了 ， 如 下 所 示 。 


stats = defaultdict (int) 







































































d= Deck () 
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h = Hand( d.pop(), d.pop(), d.pop() ) 
hf = FrozenHand( h ) 
stats[h f] += 1 


我 们 初始 化 了 一 个 数据 字典 stats， 作 为 一 个 可 以 存储 整数 的 qdefaultdict 字典 。 我 们 
也 可 以 用 collections.counter 对 象 作为 这 个 字典 。 
Hand 类 冻结 后 ， 我 们 就 可 以 将 它 用 作 字 上 典 的 键 ， 用 这 个 键 对 应 的 值 来 统计 实际 的 出 牌 次 数 。 


2.4 ”bool 0 方法 


Python 中 有 很 多 关于 真 假 性 的 定义 。 参 考 手 册 中 列举 了 许多 和 False 等 价 的 值 ， 包 括 False、 
0、"''、()、[] 和 1{}。 其 他 大 部 分 的 对 象 都 和 True 等 价 。 
通常 ， 我 们 会 用 下 面 的 语句 来 测试 一 个 对 象 是 否 “ 非 空 ”。 


if some object: 





































































































































































































process( some object ) 
默认 情况 下 , 这 个 是 内 置 的 bool () 函数 的 逻辑 。 这 个 函数 依赖 于 一 个 给 定 对 象 的 _bool _() 方 法 。 
默认 的 _pbool _() 方 法 返回 True。 我 们 可 以 通过 下 面 的 代码 来 验证 这 一 点 。 









































>>> x = object () 
>>>bool (x) 


True 

对 大 多 数 类 来 说 ， 这 是 完全 正确 的 。 大 多 数 对 象 都 不 应 该 和 False 等 价 。 但 是 ， 对 于 集合 ， 
这 样 的 行为 并 不 总 是 正确 的 。 一 个 空 集合 应 该 和 False 等 价 ， 而 一 个 非 空 集合 应 该 返回 True。 或 
许 ， 应 该 给 我 们 的 Deck 集合 对 象 增 加 一 个 类 似 的 方法 。 

如 果 我 们 在 封装 一 个 列表 ， 我 们 可 能 会 写 下 面 这 样 的 代码 。 


def bool ( self ): 
return bool( self. cards ) 


这 段 代 码 将 _bool _() 的 计算 委托 给 了 内 部 的 集合 _cards。 
如 果 我 们 在 扩展 一 个 列表 ， 可 能 会 写 下 面 这 样 的 代码 : 


def bool ( self ): 
return super(). bool ( self ) 


这 段 代码 使 用 了 基 类 中 定义 的 _bool _() 函数 。 

在 这 两 个 例子 中 ,我 们 都 将 布尔 值 的 计算 委托 给 其 他 对 象 。 在 封装 的 例子 中 ,我 们 委托 给 了 一 
个 内 部 的 集合 。 在 扩展 的 例子 中 ， 我 们 委托 给 了 基 类 。 不 管 是 封装 还 是 扩展 ， 一 个 空 集合 的 布尔 值 
都 是 False。 这 会 让 我 们 很 清楚 Deck 对 象 是 否 已 经 被 处 理 完了 。 

现在 ， 我 们 就 可 以 像 下 面 这 样 使 用 Deck。 


d = Deck() 
while dd: 
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card= d.pop() 


# process the card 









































































































































































































































这 段 代 码 会 处 理 完 Deck 中 所 有 的 牌 ， 当 所 有 的 牌 都 处 理 完 时 ， 也 不 会 抛 出 IndexError 异常 。 
2.5 bytes_ 0 方法 

只 有 很 少 的 情景 需要 我 们 把 对 象 转换 为 字 节 。 在 第 2 部 分 “持久 化 和 序列 化 ”中 ， 我 们 会 详细 
探讨 这 个 主题 。 

通常 ， 应 用 程序 会 创建 一 个 字符 串 ， 然 后 使 用 Python 的 IO 类 内 置 的 编码 方法 将 字符 串 转 换 为 
字 节 。 对 于 大 多 数 情况 ， 这 种 方法 就 足够 了 。 只 有 当 我 们 自 定义 一 种 新 的 字符 串 时 ， 我 们 会 需要 定 
义 这 个 字符 串 的 编码 方法 。 

依据 不 同 的 参数 ，pytes () 函数 的 行为 也 不 同 。 

@ bytes (integer): 返回 一 个 不 可 变 的 字 节 对 象 ， 这 个 对 象 包含 了 给 定数 量 的 0x00 值 。 

@ bytes (string): 这 个 版 本 会 将 字符 串 编码 为 字 节 。 其 他 的 编码 和 异常 处 理 的 参数 会 定 

义 编 码 的 具体 过 程 。 
@ bytes (something) : 这 个 版 本 会 调用 something. bytes _() 创建 字 节 对 象 。 这 里 



























































不 用 编码 或 




















错误 处 理 参 数 o 














基本 的 object 对 象 没有 定义 _bytes ()。 这 意味 着 所 有 的 类 在 默认 情况 下 都 没有 提供 
_pbytes () 方 法 。 






























































在 一 些 特殊 














开 且 使 用 








式 可 以 角 





无 法 解码 的 。 在 这 种 情况 下 ， 我 们 需要 解析 从 字 节 解码 出 来 的 字符 串 ， 或 者 我 们 可 以 显 式 地 调用 
struct 模块 解析 字 节 ， 然 后 基于 解析 出 来 的 值 创建 我 们 的 自 定义 对 象 。 












































4 况 下， 在 写 入 文件 之 前 ,我们 需要 将 一 个 对 象 直 接 编码 成 字 节 。 通 常 使 用 字符 串 
str 类 型 为 我 们 提供 字符 串 的 字 节 表示 会 更 简单 。 要 注意 ， 当 操作 字 节 时 ， 没 有 什么 快捷 方 













































































曼 码 文件 或 者 接口 中 的 字 节 。 内 置 的 bytes 类 只 能 解码 字符 串 ， 对 于 我 们 的 自 定义 对 象 ， 是 












































































































































下 面 我 们 来 看 看 如 何 把 card 编码 和 解码 为 字 节 。 由 于 carq 只 有 52 个 可 能 的 值 ， 所 以 每 一 




















人 小 ran 



































张 牌 都 应 该 作为 


人 


单独 的 字 节 。 人 但是， 我们 已 经 决定 用 一 个 字符 表示 suit， 用 另外 一 个 字符 表 
k。 此 外 ， 我 们 还 需要 适当 地 重 构 carg 的 子 类 ， 所 以 我 们 必须 对 下 面 这 些 项 目 进行 编码 。 
































Card 的 子 类 (AceCard、NumberCard、FaceCard)。 
@ 子 类 的 _init _() 参数 。 





注意 ， 我 们 有 





些 jnit () 方 法 会 将 一 个 数值 类 型 的 rank 转换 为 一 个 字符 串 ， 导 致 丢 失 























了 原始 的 数值 。 为 了 使 字 节 编码 可 逆 ， 我 们 需要 重新 创建 rank 的 原始 数值 。 
下 面 是 _bytes () 的 一 种 实现 ， 返 回 了 card、rank 和 suit 的 UTF-8 编码 。 


def bytes ( 
Class code= self. class . name [0] 
rank number str = {'A'I: 1, 'J': 11', 'Q': '12', 'K': '13'}.get( self.rank, 








self ): 





2.6 


self.rank ) 
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string= "("+" ".join([class code, rank number str, self.suit,] ) + ")" 


return bytes (string,encoding="utf8") 





























这 种 实现 首先 用 字符 串 表 示 carg 对 象 ， 然 后 将 字符 串 编 码 为 字 节 。 这 通常 是 最 简单 也 是 最 灵 


活 的 方法 。 





























的 card 对象。 下 面 是 基于 字 节 创建 card 对 象 的 方法 。 


def card from bytes( buffer ) : 
string = buffer.decode ("utf8") 











当 我 们 拿 到 一 串 字 节 时 ， 我 们 可 以 将 这 串 字 节 解码 为 一 个 字符 串 ， 然 后 将 字符 串 转 换 为 一 个 新 


assert string[0 ]=="(" and string[-1] == ")" 
code, rank number, suit = string[1:-1] .split() 
class = { 'A': AceCard, 'N': NumberCard, 'F': FaceCard }[codel] 


return class ( int (rank number), suit ) 


在 上 面 的 代码 中 ， 我 们 将 字 节 解码 为 一 个 字符 串 。 然 后 我 们 将 字符 串 解析 为 数值 。 基 于 这 些 值 ， 











现在 我 们 可 以 重建 原始 的 card 对 象 。 
我 们 可 以 像 下 面 这 样 生 成 一 个 Card 对 象 的 字 节 表示 。 
b= bytes (someCard) 
然后 我 们 可 以 用 生成 的 字 节 重新 创建 card 对 象 。 


someCard = card from bytes (b) 



































需要 特别 注意 的 是 ,通常 自己 定义 字 节 表示 是 非常 有 挑战 性 的 ， 因 为 我 们 试图 表示 一 个 对 象 的 


























状态 。Python 中 己 经 内 置 了 很 多 字 节 表示 的 方式 ， 通 常 这 些 方法 足够 我 们 使 用 了 















































o 





如 果 需 要 定义 一 个 对 象 底层 的 字 节 表示 方式 ， 最 好 使 用 pickle 或 者 json 模块 。 在 第 9 章 “ 序 
列 化 和 保存 一 一 JSON、YAML、Pickle、CSV 和 XML” 中 ， 我 们 会 详细 探讨 这 个 主题 。 


2.6 比较 运算 符 方 法 








Python 有 6 个 比较 运算 符 。 这 些 运 算 符 分 别 对 应 一 个 特殊 方法 的 实现 。 根 和 
殊 方 法 的 对 应 关系 如 下 所 示 。 
@ x<y 调 用 x. 1lt _ (y)。 

















x <=y 调用 x. le (y)。 





x == y 调 用 x. eq (y)。 





国 


© 
全 
@@ x != y 调用 x. ne __ (y) 。 
湖 
售 





x > y 调 用 x. gt _(y)。 








国 


x >= y 调 用 x. ge (y)。 


























我 们 会 在 第 7 章 “ 创 建 数 值 类 型 ”中 再 探讨 比较 运算 符 。 











居 文 档 ， 运 算 符 和 特 











46 第 2 章 与 Python 无 颖 集成 基本 特殊 方法 














对 于 实际 上 使 用 了 哪个 比较 运算 符 , 还 有 一 条 规则 。 这 些 规则 依赖 于 作为 左 操作 数 的 对 象 定义 






































需要 的 特殊 方法 。 如 果 这 个 对 象 没有 定义 ，Python 会 尝试 改变 运算 顺序 。 
下 面 是 两 条 基本 的 规则 : 
首先 ， 运 算 符 的 实现 基于 左 操作 数 : A<B 相当 于 A. 1t _(B)。 
>» 其 次 ,相反 的 运算 符 的 实现 基于 右 操作 数 :A<B 相当 于 B. gt__(A)。 
Q 如 果 右 操作 数 是 左 操作 数 的 一 个 子 类 ， 那 这 样 的 比较 基本 不 会 有 
什么 异常 发 生 ; 同时 ，Python 会 首先 检测 右 操作 数 ， 以 确保 这 个 
子 类 可 以 重 载 基 类 。 





下 面 ,我 们 通过 一 个 例子 看 看 这 两 条 规则 是 如 何 工作 的 ,我 们 定义 了 一 个 只 包含 其 























符 实现 的 类 ， 然 后 把 这 个 类 用 于 另外 一 种 操作 。 
下 面 是 我 们 使 用 类 中 的 一 段 代码 。 


class BlackJackCard p: 























def init ( self, rank, suit ) : 
self.rank= rank 
self.suit= suit 
def 1]t ( self, other ): 
print( "Compare {0} < {1}".format( self, other ) ) 
return self.rank < other.rank 
def _ str ( self ): 


return "{rank}{suit}".format ( **self. dict  ) 





中 一 个 运算 


这 段 代 码 基于 21 点 的 比较 规则 ， 花 色 对 于 大 小 不 重要 。 我 们 省 略 了 比较 方法 ， 看 看 当 缺 少 比 
较 运算 符 时 ，Python 将 如 何 回 退 。 这 个 类 允许 我 们 进行 < 比较 。 但 是 有 趣 的 是 ， 通 过 改变 操作 数 的 
顺序 ，Python 也 可 以 使 用 这 个 类 进行 > 比较 。 换 名 话说 ，x<y 和 y>x 是 等 价 的 。 这 遵从 了 镜像 反射 法 




























































































则 ; 在 第 7 章 “ 创 建 数值 类 型 ”中 ， 我 们 会 再 探讨 这 个 部 分 。 























当 我 们 试图 评估 不 同 的 比较 运算 时 就 会 看 到 这 种 现象 。 下 面 ， 我 们 创建 两 个 cards 类 ， 然 后 用 








不 同 的 方式 比较 它们 。 


>>> two = BlackJackCard p( 2, '@' ) 
>>> three = BlackJackCard p( 3, '' ) 
>>> two < three 

Compare 24 < 34 

True 
>>> two > three 
Compare 34 < 24 
False 
>>> two == three 
False 
>>> two <= three 





Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 





TypeError: unorderable types: BlackJackCard p() <= BlackJackCard p() 
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从 代码 ! 
但 是 ， 对 于 two > three， 
用 的 比较 方法 。 
默认 情况 下 ，_ ea __ 
或 != 比 较 对 象 时 ， 结 果 如 下 。 


>>> two c = BlackJackCard p( 2， 








































































































>>>two == 七 WO_C 
False 
可 以 看 到 ， 结 果 和 我 们 预期 的 不 同 。 





此 外 ,逻辑 上 ， 不 同 的 运算 符 之 间 是 没有 联系 的 。 但 

















， 我 们 可 以 看 到 ，two < three 调用 
于 没有 定义 _gt 














Ttwo. 
() ，Python 使 用 





lt (three).。 














three. 





() 方法 从 object 继承 而 来 ， 它 比较 不 同 对 象 的 ID 值 。 


'%! ) 











所 以 ， 我 们 通常 都 会 需要 重 载 默认 的 _eq _() 实现 。 





t (two) 作为 备 


当 我 们 用 于 == 























是 从 数学 的 角度 来 看 ， 
































我 们 可 以 基于 两 个 运算 符 
看 的 4 组 比较 是 等 价 的 。 

















完成 所 有 必需 的 比较 运算 。Python 没有 实现 这 种 机 制 。 相 反 ，Python 默认 认为 下 
XX<y=y>x 
XZy=y 二 x 
X=yy=x 
XFYEY FX 
这 意味 着 , 我 们 必须 至 少 提供 每 组 中 的 一 个 运算 符 。 例如, 我 可 以 提供 eq 
lt _() 和 1e __() 的 实现 。 





@functools.total ordering 修 










































































































































































饰 符 打破 了 这 种 默认 行为 的 局 限 性 ， 它 可 以 从 _eq 


() 

















或 者 lt ()、 le ()、 gt () 和 ge () 的 任意 一 个 中 推断 出 其 他 的 比较 方法 。 在 第 7 章 
“创建 数值 类 型 ”中 ， 我 们 会 和 
2.6.1 设计 比较 运算 

当 设 计 比 较 运算 符 时 ， 要 考虑 两 个 因素 。 

@ 如 何 比较 同一 个 类 的 两 个 对 象 。 

@ 如何 比 较 不 同类 的 对 象 。 

对 于 一 个 有 许多 属性 的 类 ， 当 我 们 研究 它 的 比较 运算 符 时 ， 通 常会 觉得 有 很 明显 的 歧义 。 或 许 

这 些 比较 运算 符 的 行为 和 我 们 的 预期 不 完全 相同 。 

再 次 考虑 我 们 21 点 的 例子 。 例 如 cardql1==carq2 这 样 的 表达 式 ， 很 明显 ， 它 们 比较 了 rank 
和 suit, 对 吗 ? 但 是 , 这 总 是 和 我 们 的 预期 一 致 吗 ? 毕竟 ，suit 对 于 21 点 中 的 比较 结果 没有 影响 。 

如 果 我 们 想 决 定 是 否 能 分 牌 ， 我 们 必须 决定 下 面 两 个 代码 片段 哪 一 个 更 好 。 下 面 是 第 1 个 代码 段 。 

















if hand.cards[0] == hand.cards[ 


下 面 是 第 2 个 代码 段 。 





if hand.cards[0] .rank == hand.cards[1] 























1] 


.rank 
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们 创建 单元 测试 时 会 有 问题 , 例如 一 个 简单 的 Testcase.assertEqual () 
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Cards 对 象 ， 但 是 一 个 单元 测试 应 该 只 关注 正确 的 Cards 对 象 。 





例如 cardql <= 7， 很 明显 ， 这 个 表达 式 想 要 比较 的 是 rank。 



































算 中 使 用 了 多 个 属性 值 ， 那 么 也 必须 在 相等 性 比较 中 使 用 它们 。 在 这 种 情况 下 ， 








果 我 们 想 要 按 suit 排序 需要 做 什么 ? 而 且 ， 相 等 性 比较 必须 同时 计算 哈 




































































虽然 其 中 一 个 更 短 ， 但 是 简洁 的 并 不 总 是 最 好 的 。 如 果 我 们 比较 牌 时 只 考虑 rank， 那 么 当 我 











方法 就 会 接受 很 多 不 同 的 





我 们 是 否 需要 在 一 些 比较 中 比较 cards 对 象 所 有 的 属性 ， 而 在 另 一 些 比较 中 只 关注 rank? 如 


希 值 。 我 们 在 哈 希 值 的 计 


较 必须 比较 完整 的 carq 对 象 ， 因 为 在 计算 哈 希 值 时 使 用 了 rank 和 suit。 
但 是 ， 对 于 card 对 象 间 的 排序 比较 ， 应 该 只 需要 基于 rank。 类 似 地 ， 如 果 和 整数 比较 ， 


也 应 该 只 关注 rank。 对 于 判断 是 否 要 发 牌 的 情况 ， 很 明显 , 用 hangd.cards[0]. rank == 


















































cards[1] .rank 判断 是 很 好 的 方式 ， 因 为 它 遵 守 了 发 牌 的 规则 。 
2.6.2 pp 

















下 面 我 们 通 BlackJackCard 类 来 看 一 下 简单 的 同类 比较 。 
class BlackJackCard: 
def init ( self, rank, suit, hard, soft ) : 


self.rank= rank 

self.suit= suit 

self.hard= hard 

self.soft= soft 

def _]t ( self, other ) : 
if not isinstance( other, BlackJackCard ): return 
NotImplemented 
return self.rank < other.rank 


def le ( self, other ): 
try: 
return self.rank <= other.rank 





except AttributeError: 
return NotImplemented 
def gt ( self, other ): 
if not isinstance( other, BlackJackCard ): return 
NotImplemented 
return self.rank > other.rank 
def. ‘We (Self; other .): 
if not isinstance( other, BlackJackCard ): return 
NotImplemented 
return self.rank >= other.rank 
def eq ( self, other ): 


if not isinstance( other, BlackJackCard ): return 
NotImplemented 
return self.rank == other.rank and self.suit == other.suit 


def ne ( self, other ): 








很 明显 相等 性 的 比 


hand. 
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if not isinstance( other, BlackJackCard ) : return 
NotImplemented 
return self.rank != other.rank and self.suit != other.suit 


def str ( self ): 
return "{rank}{suit}".format( **self. dict ) 

现在 我 们 定义 了 6 个 比较 运算 符 。 

我 们 已 经 展示 了 两 种 类 型 检查 的 方法 : 显 式 的 和 隐 式 的 。 显 式 的 类 型 检查 调用 了 isinstance () 。 
隐 式 的 类 型 检查 使 用 了 一 个 try: 语 句 块 。 理 论 上 ， 使 用 try: 语 句 块 有 一 个 小 小 的 优点 : 它 避 免 了 重复 
的 类 名 称 。 有 的 人 完全 可 能 会 想 创建 一 种 和 这 个 BlackJackCard 兼容 的 Card 类 的 变种 , 但 是 并 没有 
适当 地 定义 为 一 个 子 类 。 这 时 候 使 用 isinstance () 有 可 能 导致 一 个 原本 正确 的 类 出 现 异常 。 

使 用 try :语句 块 可 以 让 一 个 碰巧 也 有 一 个 rank 属性 的 类 仍然 可 以 正常 工作 ,不 用 担心 这 样 会 
带 来 什么 难 , 因为 它 除 了 在 此 处 被 真正 使 用 外 , 这 个 类 在 程序 的 其 他 部 分 都 无 法 被 正常 使 用 。 而 且 ， 
谁 会 真 的 去 比较 一 个 card 的 实例 和 一 个 金融 系统 中 恰好 有 rank 属性 的 类 呢 ? 

后 面 的 例子 中 , 我 们 主要 会 关注 try :语句 块 的 使 用 。isinstance () 方 法 是 Python 中 惯用 的 
方式 ， 而 且 也 被 广泛 应 用 。 我 们 通过 显 式 地 返回 Not Implemented 告诉 Python 这 个 运算 符 在 当 
前 类 型 中 还 没有 实现 。 这 样 ，Python 可 以 尝试 交换 操作 数 的 顺序 来 看 看 另外 一 个 操作 数 是 否 提供 
了 对 应 的 实现 。 如 果 没 有 找到 正确 的 运算 符 ， 那 么 Python 会 抛 出 TypeError 异常 。 

我 们 没有 给 出 3 个 子 类 和 工厂 函数 : cargd21 () 的 代码 ， 它 们 作为 本 章 的 习题 。 

我 们 也 没有 给 出 类 内 比较 的 代码 , 这 个 我 们 会 在 下 一 个 部 分 中 详细 讲解 ,用 上 面 定义 的 这 个 类 ， 
我 们 可 以 成 功 地 比较 不 同 的 牌 。 下 面 是 一 个 创建 并 比较 3 张 牌 的 例子 。 











































































































































































































































































































































































































































































































































































































>>> two = card21( 2, '@' ) 

>>> three = card21( 3, '%' ) 

>>> two c = card21( 2, '®' ) 

用 上 面 定义 的 cards 类 ， 我 们 可 以 进行 像 下 面 这 样 的 一 系列 比较 。 
>>> 七 WO == 七 WO_C 

False 

>>> two.rank == two c.rank 

True 


>>> two< three 
True 
>>> two c < three 





True 


这 个 类 的 行为 与 我 们 预期 的 一 致 。 


2.6.3 ”实现 不 同类 的 对 象 比 较 


我 们 会 继续 以 BlackJackCard 类 为 例 来 看 看 当 两 个 比较 运算 中 的 两 个 操作 数 属于 不 同 的 类 
时 会 发 生 什么 。 
下 面 我 们 将 一 个 carq 实例 和 一 个 int 值 进 行 比较 。 
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>>> 七 WO = card21( 


>>> two < 2 





>>> two > 2 


























TypeError: unorderable 


Traceback (most recent 
File "<stdin>", 


ypeError: unorderabl 


2 | 


types: 


types: 











可 以 看 到 ， 这 和 我 们 预 
需 的 特殊 方法 ， 所 以 产 4 





人 Typel 























但 是 ， 再 考虑 下 面 和 


>>> two == 2 
False 
>>> two == 3 
False 


为 什么 用 等 号 比较 可 以 返 











两 个 例子 。 


基本 特殊 方法 


Traceback (most recent call last): 
File "<stdin>", 1, in <module> 


Number21Card() < int() 


call last): 
1, in <module> 
Number21Card() > int() 





交换 两 个 操作 数 的 顺序 。 在 这 个 例子 
和 一 个 非 数值 类 型 的 对 象 比较 。 












































， 由 于 整 型 的 值 定义 了 

















2.6.4 硬 总 和 、 软 总 和 及 多 态 


接 下 来 ， 我 们 定义 Hang 类 ， 这 样 它 可 以 有 意义 ] 
须 确 定 我 们 要 比较 的 内 容 。 

对 于 Hang 类 之 间 相 等 改 

而 对 于 Hang 类 之 


























的 比较 ， 我 们 应 该 比较 


所 有 的 牌 。 























较 ， 我 们 应 该 将 当前 日 
中 硬 总 和 与 软 总 和 的 细 
当 手 上 有 一 张 A 

































































@ 软 总 和 把 A 上牌 当 作 11 点 。 锥 
@ 硬 总 和 把 A 牌 当 作 1 点 。 
































时， 下 面 是 两 种 可 能 的 总 和 。 
[ 果 软 总 和 超过 21 点， 那么 这 张 A 牌 就 不 可 用 。 





期 的 行为 一 至，BlackJackCard 的 子 类 Number21Card 没有 实现 必 


Error 异常 。 

















回 结果 呢 ? 因为 当 Python 遇 到 NotImplemented 的 值 时 ， 会 尝试 
个 int. eq () 方 法 ， 所 以 可 以 




















地 比较 不 同 的 类 。 和 其 他 的 比较 一 样 ， 我 们 必 





闻 顺 序 的 比较 ， 我 们 需要 比较 每 一 个 Hang 对 象 的 属性 。 对 于 与 int 值 的 比 
nd 对 象 的 总 和 与 int 值 进行 比较 。 为 了 获 





























当前 总 和 ， 我 们 需要 弄 清 21 点 























也 就 是 说 ， 手 ! 











丐 | 有田 晶 

















是 简单 地 累加 所 有 的 上 


























首先 ， 我 们 需要 确定 
于 21 点 ) 的 软 总 和 。 和 否则 ， 我 1 

对 于 确定 子 类 与 基 类 的 关系 逻辑 上 
标志 。 通 常 ， 这 样 的 做 法 不 符合 基本 的 封装 原则 。 


























想 状 态 下 ， 类 的 定义 是 不 可 见 的 , 我 们 





isinstance () 。 在 




















是 否 有 A 


门 就 要 使 















































人 硬 总 和 。 








的 实 




















牌 。 然 后 ， 我 




















个 可 用 的 (小 于 或 者 等 














钢 是 否 依赖 于 isinstance ()， 是 判断 多 态 使 用 是 否 合理 的 

















个 好 的 子 类 定义 应 该 只 依赖 于 相同 的 方法 签名 。 理 














也 没有 必要 知道 类 内 部 的 细节 。 而 不 合理 的 多 态 则 会 广泛 地 使 用 
青 况 下 ，isinstance () 是 必需 的 , 尤其 是 当 使 




































































]j Python 内 置 的 类 时 。 但 是 ， 





2.6 








我 们 不 应 该 向 内 置 类 











追加 任何 方法 函数 ， 而 且 为 











在 一 些 没有 继承 





的 交互 。 在 下 一 个 部 分 中 ， 我 们 会 展示 在 没有 关系 





















































的 特殊 方法 中 ， 我 们 可 以 看 到 | 
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旦 





了 加 入 一 个 多 态 的 方法 而 去 使 
j 必 须 使 用 
的 类 间 














1Isinstance( 





) 的 方法 。 


使 用 isinstance( 






















































































































































































































































































继承 也 是 不 值得 
) 来 实现 不 同类 的 对 象 间 


的 。 






























































































































































































































































对 于 与 Card 相关 的 类 ， 我 们 希望 用 一 个 方法 (或 者 一 个 属性 ) 就 可 以 识别 一 张 A 牌 ， 而 不 需 
要 调用 isinstance () 。 这 个 方法 是 一 个 多 态 的 辅助 方法 ， 它 可 以 确保 我 们 能 够 辨别 不 同 的 牌 。 

这 里 ， 我 们 有 两 个 选择 。 

@ 新 增 一 个 类 级 别 的 属性 。 

@ 新 增 一 个 方法 。 

由 于 保险 注 的 存在 ， 有 两 个 原因 让 我 们 检测 是 否 有 A 牌 。 如 果 庄 家 牌 是 A 牌 ， 那 么 就 会 触发 
一 个 保险 注 。 如 果 庄 家 或 者 玩家 的 手 上 有 A 牌 ， 那 么 需要 对 比 软 总 和 与 硬 总 和 。 

对 于 A 牌 而 言 ， 硬 总 和 与 软 总 和 总 是 需要 通过 carg .soft-card.hard 的 值 来 区 分 。 仔 细 看 看 
AceCardgd 的 定义 就 可 以 知道 这 个 值 是 10。 但 是 ， 仔 细 地 分 析 这 个 类 的 实现 ， 我 们 就 会 发 现 这 个 版 
本 的 实现 会 破坏 封装 性 。 

我 们 可 以 把 BlackJackcard 看 作 不 可 见 的 ， 所 以 我 们 仅仅 需要 比较 cargd.soft-card. 
hard!=0 的 值 是 否 为 真 。 如 果 结 果 为 真 ， 那 么 我 们 就 可 以 用 硬 总 和 与 软 总 和 算出 手中 牌 的 总 和 。 

下 面 是 total 方法 的 一 种 实现 ， 它 使 用 硬 总 和 与 软 总 和 的 差 值 计算 出 当前 手中 牌 的 总 和 。 

def total( self ): 

delta soft = max( c.soft-c.hard for c in self.cards ) 
hard = Sum( c.hard for c in self.cards ) 

if hardtdelta soft <= 21: return hardtdelta soft 
return hard 

我 们 用 qelta_soft 记录 硬 总 和 与 软 总 和 之 间 的 最 大 差 值 。 对 于 其 他 牌 而 言 ， 这 个 差 值 是 0。 
但 是 对 于 A 牌 ， 这 个 差 值 不 是 0。 

得 到 了 delta_soft 和 硬 总 和 之 后 ， 我 们 就 可 以 决定 返回 值 是 什么 。 如 果 hard + delta soft 
小 于 或 者 等 于 21， 那 么 就 返回 软 总 和 。 如 果 软 总 和 大 于 21， 那 么 就 返回 硬 总 和 。 

我 们 可 以 考虑 把 21 定义 为 宏 。 有 时 候 一 个 有 意义 的 名 字 比 一 个 字面 值 更 有 用 。 但 是 ， 因 为 21 
在 21 点 中 几乎 不 可 能 变 成 其 他 值 ， 所 以 很 难 找到 其 他 比 21 更 有 意义 的 名 字 。 

2.6.5 不 同类 比较 的 例子 

定义 了 Hand 对 象 的 总 和 之 后 ,我 们 可 以 合理 地 定义 Hang 实例 间 的 比较 函数 和 Hang 与 int 

闻 的 比较 函数 。 为 了 确定 我 们 在 进行 哪 种 类 型 的 比较 ， 必 须 使 用 isinstance () 。 





class Hand: 
def 


init 








( self, dealer card, 


self.dealer card= dealer card 


self.cards= list (cards) 


*cards 








下 面 是 定义 了 比较 方法 的 Hang 类 的 部 分 代码 。 


) 
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def str ( self ): 
return "“, ".join( map(str, self.cards) ) 
def _ repr ( self ): 


return "{ class . name }({dealer card!r}, {_cards str})".format( 





class =self. class , 





_Ccards str=", ".join( map(repr, self.cards) ), 
*x*self. dict  ) 


def: “eq. (Self, ‘OEher 全 


if isinstance (other,int): 


return self.total() == other 
try: 
return (self.cards == other.cards 
and self.dealer card == other.dealer card) 





except AttributeError: 
return NotImplemented 
def 1]t ( self, other ): 
if isinstance (other,int): 
return self.total() < other 
try: 
return self.total() < other.total() 
except AttributeError: 





return NotImplemented 
def le ( self, other ) : 
if isinstance (other,int): 
return self.total() <= other 
try: 
return self.total() <= other.total () 
except AttributeError: 





return NotImplemented 
_hash = None 
def totall( self ) : 


delta soft = max( c.soft-c.hard for c in self.cards ) 


hard = Sum( c.hard for c in self.cards ) 
if hard+delta soft <= 21: return hardtdelta soft 
return hard 


这 里 我 们 只 定义 了 3 个 比较 方法 。 

为 了 和 Hand 对 象 交互 ， 我 们 需要 一 些 Card 对 象 。 
>>> two = card21( 2，' 4 ) 

>>> three = card21( 3, '%' ) 

>>> two c = card21( 2, '®' ) 


>>> ace = card21( 1, '%®%' ) 


>>> cards = ace, 七 Wo two c, three | 


我 们 会 把 这 些 牌 用 于 两 个 不 同 Hand 对 象 。 


















































第 1 个 Hand 对 象 有 一 张 不 相关 的 庄家 牌 和 我 们 上 面 创建 的 4 张 





EE， 包括 


张 A 














也 没有 任何 与 Hand 相关 的 ”1t _() 方 法 定义 。 


2.7 del 0 方法 


>>> h= Hand( card21(10,''), *cards ) 
>>> print (h) 

A,， 24，2 史 ，34 

>>> h.total() 

18 





软 总 和 是 18， 硬 总 和 是 8。 
下 面 是 第 2 个 Hang 对 象 ， 除 了 上 面 第 1 个 Hand 对 象 的 4 张 牌 ， 还 包括 了 另 一 张 牌 。 


>>> h2= Hand( card21(10,'@'), card21(5,'®'), *cards ) 
>>> print (h2) 

54，A，24， 2 和，34 

>>> h2.total () 

13 


硬 总 和 是 13， 由 于 总 和 超过 了 21 点 ， 所 以 没有 软 总 和 。 
从 下 面 的 代码 中 可 以 看 到 ，Hand 对 象 之 间 的 比较 结果 和 我 们 预期 的 一 致 。 


>>> Ph < h2 
False 
>>> hn > Ph2 
True 


我 们 可 以 用 比较 运算 符 对 Hand 对 象 排序 。 
我 们 也 可 以 像 下 面 这 样 把 Hand 对 象 和 int 比较 。 


>>> h == 18 
True 
>>> hn < 19 




































































True 

>>> h > 17 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 








TypeError: unorderable types: Hand() > int() 

































































只 要 Python 没有 强制 使 用 后 备 的 比较 方法 ，Hand 对 象 和 整数 的 比较 就 可 以 很 好 地 工作 。 上 症 
的 例子 也 展示 了 当 没 有 定义 _gt__() 方 法 时 会 发 生 什 么 。Python 检查 另 一 个 操作 数 ， 但 是 整数 17 
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我 们 可 以 添加 必要 的 _gt _() 和 ge _() 函数 ， 这 样 Hand 就 可 以 很 好 地 与 整数 进行 比较 。 


2.7 _del 0 方法 




















del () 方 法 有 一 个 让 人 费解 的 使 用 场景 。 











这 个 方法 的 目的 是 在 将 一 个 对 象 从 内 存 中 清除 之 前 ， 可 以 有 机 会 做 一 些 清理 工作 。 如 果 使 用 上 







































































下 文 管理 对 象 或 者 with 语句 来 处 理 这 种 需求 会 更 加 清晰 ， 这 也 是 第 5 草 “ 可 调用 对 象 和 上 下 文 的 





















































j ”的 内 容 。 对 于 Python 的 垃圾 回收 机 制 而 言 ， 创 建 一 个 上 下 文 比 使 用 gel _() 更 加 容易 预 判 。 
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当 一 
_ del () 方 法 的 这 种 行为 ， 

















第 2 章 与 Python 无 终 集 成 基本 


但 是 ， 如 果 一 个 Python 对 象 包 含 了 一 些 操 作 系 统 的 资源 ， qel _() 方法 是 把 资源 从 程序 ' 
于 的 文件 、 安 装 好 的 设备 或 者 子 进程 的 对 象 ， 如 果 我 们 将 资 
源 释 放 作 为 ”del _() 方 法 的 一 部 分 实现 ， 那 么 我 们 就 可 以 保证 这 些 资源 最 后 会 被 释放 。 
很 难 预测 什么 时 候 ” qel _() 方 法 会 被 调用 。 它 3 
个 对 象 因为 命名 空间 被 移 除 而 被 











特殊 方法 





释放 的 最 后 机 会 。 例如， 引用 了 一 个 打 ] 


















































不 总 是 在 使 用 del 语句 删除 对 象 时 被 调用 ， 









































对 地 ， 会 使 用 sys . stderr 打印 一 个 警告 。 












































1 除 时 ， 它 也 不 一 定 被 调用 。Python 文档 中 用 不 稳定 来 描述 
并且 提供 了 额外 的 关于 异常 处 理 的 注释 : 运行 期 的 异常 会 被 忽略 ， 相 












































基于 上 面 的 这 些 原因 ， 通 常 更 倾向 于 使 用 上 下 文 管理 器 ， 而 不 是 实现 gel ()。 








2.7.1 引用 计数 和 对 象 销毁 


CPython 的 实现 中 ， 对 象 会 包括 一 个 引用 计数 器 。 当 对 象 被 赋值 给 一 个 变量 时 ， 这 个 计数 器 会 
递增 ， 当 变量 被 删除 时 ， 这 个 计数 器 会 递减 。 当 引用 计数 器 的 值 为 0 时 ， 表 示 我 们 的 程序 不 再 需要 


这 个 对 象 } 






































被 调用 。 
我 们 用 下 面 的 一 个 类 来 看 看 这 个 过 程 中 到 底 发 生 了 什么 。 


class Noisy: 
def del ( self ): 


这 也 就 是 说 当 变 量 x 被 删除 后 ， 引 用 计数 器 


Noisy 实例 ， 所 以 它 也 可 以 被 清除 。 

















print( 


可 以 销毁 这 个 对 象 。 对 了 
对 于 包含 循环 引用 的 复杂 对 象 ， 引 用 i 




















F 简 单 对 象 ， 当 执行 














删除 对 象 的 操作 时 会 调用 qel _() 方 法 。 





















































我 们 可 以 像 下 面 这 样 创建 和 删除 这 个 对 象 。 


>>> x= Noisy() 


>>>del x 


Removing 4313946640 


我 们 先 创建 ， 





然后 删除 了 Noisy 
























































下 面 是 浅 复制 中 一 种 常见 的 情形 。 


>>> ln = | 











Noisy(), Noisy() 


>>> ln2= ln[:] 


>>> del ln 


Python 没有 响应 del 语句 。 这 说 明 这 些 Noisy 对 象 的 引用 计数 器 还 没有 归 零 ， 肯 定 还 有 











地 方 引用 了 它们 ， 


>>> del 1ln2 
Removing 4313920336 
Removing 4313920208 











十 数 器 有 可 能 永远 也 不 会 归 零 ， 这样 就 很 难 让 del _() 


"Removing {0}".format (id(self)) ) 

















对 象 ， 几 乎 是 立刻 就 看 到 了 qel _() 方 法 中 输出 的 消息 。 








] 


下 面 的 代码 验证 了 这 一 点 。 




















ln2 变量 是 





ln 列表 的 一 个 浅 复 


E 确 地 归 零 了 。 一 旦 变量 被 删除 ， 就 没有 任何 地 方 引 用 












































I 





他 









































判 。 有 两 个 列表 引用 








了 Noisy 对 象 ， 所 以 在 这 两 个 列表 被 删 
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除 并 且 引 用 计数 器 归 零 之 前 ，Python 不 会 销毁 这 两 个 Noisy 对 象 。 
还 有 很 多 种 创建 浅 复 制 的 方法 。 下 面 是 其 中 的 一 些 。 


a=b = Noisy() 
c= [ Noisy() ] * 2 


这 里 的 关键 是 , 由 于 浅 复制 在 Python 中 非常 普遍 ， 所 以 我 们 往往 对 存在 的 对 象 的 引用 感到 非常 困惑。 
2.7.2 ”循环 ?| 用 和 垃圾 回收 


下 面 是 一 种 常见 的 循环 引用 的 情形 。 一 个 父 类 包含 一 个 子 类 的 集合 ， 同 时 集合 中 的 每 个 子 类 实 
例 又 包含 父 类 的 引用 。 
下 面 我 们 用 这 两 个 类 来 看 看 循环 引用 。 
class Parent : 

def nit ( ‘self; *children ) 


self.children= list (children) 
for child in self.children: 





































































































child.parent= self 
def del ( self ): 
print( "Removing {_ class . name } {id:d}". 





format ( class =self. class , id=id(self)) ) 





class Child: 
def del ( self ): 
print( "Removing {_ class . name } {id:d}". 





format ( class =self. class , id=id(self)) ) 








一 个 Parent 的 instance 包括 一 个 children 的 列表 。 

每 一 个 child 的 实例 都 有 一 个 指向 Parent 类 的 引用 。 当 向 Parent 内 部 的 集合 中 插入 新 的 
chilg 实例 时 ， 这 个 引用 就 会 被 创建 。 

我 们 故意 把 这 两 个 类 写 得 比较 复杂 ， 所 以 下 面 让 我 们 看 看 当 试 图 删除 对 象 时 ， 会 发 生 什 么 。 

>>>> p = Parent( Child(), Child() ) 

>>> id(p) 

4313921808 

>>> del p 

Parent 和 它 的 两 个 初始 cnila 实例 都 不 能 被 删除 ， 因 为 它们 之 间 互 相 引 用 。 

下 面 ， 我 们 创建 一 个 没有 child 集合 的 Parent 实例 。 


>>> p= Parent () 

>>> id(p) 

4313921744 

>>> del p 

Removing Parent 4313921744 


和 我 们 预期 的 一 样 ， 这 个 Parent 实例 成 功 地 被 删除 了 。 
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于 互相 之 间 有 引用 存在 ， 因 此 我 们 不 能 从 内 存 中 删除 Parent 实例 和 它 包 含 的 chilg 实例 的 
集合 。 如 果 我 们 导入 垃圾 回收 器 的 接口 一 一 gc， 我 们 就 可 以 回收 和 显示 这 些 不 能 被 删除 的 对 象 。 
下 面 的 代码 中 ， 我 们 使 用 了 gc.collect () 方 法 回收 所 有 定义 了 _qel _() 方 法 但 是 无 法 被 
删除 的 对 象 。 


>>> import gc 

>>> gc.collect () 

174 

>>> gc.garbage 

[<_ main .Parent object at Ox101213910>, < main .Child object at Ox101213890>, 
< main .Child object at Ox101213650>, < main .Parent object at 0x101213850>， 
< main .Child object at Ox1012130d0>, < main .Child object at 0x101219a10>， 
< main .Parent object at 0x101213250>， < main .Child object at 0x101213090>， 
< main .Child object at Ox101219810>, < main .Parent object at 0x101213050>， 
< main .Child object at 0x101213210>, < main .Child object at 0x101219f90>， 
n 
qd 

















































































































t object at Ox101213810>, < main .Child object at 0x1012137Qq0>， 
object at 0x101213790>] 


< main .Pare 








< main .Chil 











可 以 看 到 ， 我 们 的 Parent 对 象 ( 例 如 ，4313921808 的 ID = 0x101213910) 在 不 可 删除 的 垃 
圾 对 象 列 表 中 很 突出 。 为 了 让 引用 计数 器 归 零 ， 我 们 需要 删除 所 有 Parent 对 象 中 的 childqren 
列表 ， 或 者 删除 所 有 chila 实例 中 对 Parent 的 引用 。 
注意 ， 即 使 把 清理 资源 的 代码 放 在 ”qel _() 方 法 中 ,我 们 也 没 办 法 解决 循环 引用 的 问题 。 
因为 qel _() 方 法 是 在 循环 引用 被 解除 并 且 引 用 计数 器 已 经 归 零 之 后 被 调用 的 。 当 有 循环 引用 
时 , 我 们 不 能 只 是 简单 地 依赖 于 Python 中 计算 引用 数量 的 机 制 来 清理 内 存 中 的 无 用 对 象 。 我 们 必 
须 显 式 地 解除 循环 引用 或 者 使 用 可 以 保证 垃圾 回收 的 weakref 引用 。 


2.7.3 ”循环 引用 和 weakref 模块 


如 果 我 们 需要 循环 引用 , 但 是 又 希望 将 清理 资源 的 代码 写 在 _qe1l__() 中 , 这 时 候 我 们 可 以 使 

用 弱 引 用 。 循 环 引 用 的 一 个 常见 场景 是 互相 引用 : 一 个 父 类 中 包含 了 一 个 集合 ， 集 合 中 的 每 一 

个 实例 也 包含 了 一 个 指向 父 类 的 引用 。 如 果 一 个 Player 对 象 中 包含 多 个 Hand 实例 ， 那 么 在 每 

一 个 Hand 对 象 中 都 包括 一 个 指向 对 应 的 Player 类 的 引用 可 能 会 更 方便 。 

默认 的 对 象 间 的 引用 可 以 被 称 为 强 引用 ， 但 是 ， 叫 直接 引用 可 能 更 好 。Python 的 引用 计数 机 人 

会 直接 使 用 它们 ， 而 且 如 果 引 用 计数 无 法 删除 这 些 对 象 的 话 ， 垃 圾 回收 机 器 也 能 及 时 发 现 。 它 们 是 

可 忽略 的 对 象 。 

对 一 个 对 象 的 强 引 用 就 是 直接 引用 ， 下 面 是 一 个 例子 。 
当 我 们 遇 到 如 下 语句 。 


a= B() 


变量 a 直接 引用 了 B 类 的 一 个 对 象 。 此 时 B 的 引用 计数 至 少 是 1， 因为 a 变量 包含 了 一 个 指向 
它 的 引用 。 

































































































































































































































































五 

















































































































A 
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县 要 找 个 一 个 弱 引 用 相关 的 对 象 需要 两 个 步骤 。 














一 个 弱 引 用 














2.7 
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会 调用 x .parent () ， 这 个 函数 








































































































































































































































































































将 弱 引 用 作为 一 个 可 调用 对 象 来 查找 它 真 正 的 父 对 象 。 这 个 过 程 让 引用 计数 器 得 以 归 零 ， 垃 圾 回收 
器 可 以 回收 引用 的 对 象 ， 但 是 不 回收 这 个 弱 引 用 。 

weakref 定义 了 一 系列 使 用 了 弱 引 用 而 没有 使 用 强 引 用 的 集合 。 它 让 我 们 可 以 创建 一 种 特殊 的 
字典 类 型 ， 当 这 种 字典 的 对 象 没有 用 时 ， 可 以 保证 被 垃圾 回收 。 

我 们 可 以 修改 Parent 和 child 类 ， 在 child 指向 Parent 的 引用 中 使 用 弱 引 用 ， 这 样 就 
可 以 简单 地 保证 无 用 对 象 会 被 销毁 。 

下 面 是 修改 后 的 类 ， 它 在 child 指向 Parent 的 引用 中 使 用 了 弱 引 用 。 

















import weakref 


class Parent2: 


class , 


我 们 将 child 
在 child 类 中 ， 


p = 
> 和 


init ( self, *children ) : 

self.children= list (children) 

for child in self.children: 
child.parent= weakref.ref (self) 


def 





def del ( self ): 
print( "Removing {_ class name } 
id=id(self)) ) 








的 parent 引 用 改 为 一 
我 们 必须 用 上 


self.parent () 
































is not None: 





# process p, the Parent instance 


else: 


我 们 





站 让 
学 让 


当 我 们 使 用 这 个 3 


# the parent instance was garbage collected. 
因为 有 可 外 
可 以 看 到 引用 计数 成 功 地 归 











可 以 显 式 地 确认 引用 的 对 象 是 否 已 经 找到 ， 
新 的 Parent2 类 时 ， 


p = Parent2( Child(), Child() ) 
del P 














Removing Parent2 4303253584 
Removing Child 4303256464 
Removing Child 4303043344 




















一 个 weakref 引 上 













































































个 weakref 对 象 的 引用 。 
用 说 的 两 步 操作 来 定位 parent 对 象 : 


EE 该 引用 已 经 变 成 虚 引 用 
零 同时 对 象 也 被 删除 了 : 





























{id:d}".format( 






























































@ 重新 创建 引用 对 象 ， 或 重新 从 数据 库 中 加 载 。 

@ ” 当 垃 圾 回收 器 在 低 内 存 情况 下 错误 

@ 忽略 这 个 问题 。 

通常 ，weakref 引用 变 成 死 引用 是 因为 
执行 结束 ， 一 个 没有 用 的 命名 空间 ， 应 用 程序 正在 关闭 。 对 于 这 个 原 医 
应 方法 。 因 为 试图 创建 这 个 引用 的 对 象 时 很 可 能 马上 就 会 被 删除 。 


























class =self. 





向 应 的 对 象 已 经 被 删除 了 。 例如 ， 变 量 的 作 / 
通常 我 们 会 采取 第 3 种 响 

















j 变 成 死 引 用 时 《因为 引用 被 销毁 了 )， 我 们 有 3 个 可 能 的 方案 。 





也 删除 了 一 些 对 象 时 ， 使 用 warnings 模块 记录 调试 信息 。 

















] 域 已 经 








58 第 2 章 与 Python 无 终 集 成 














基本 特殊 方法 


2.7.4 _del 0 和 close0 方 法 


_del | 

















() 最 常见 的 

















] 途 是 确保 文 伯 





被 关闭 。 











_del = Close 








通常 ， 包 含 文件 操作 的 类 都 会 有 类 似 下 面 这 柱 

















的 代码 。 


这 会 保证 _del _() 方 法 同时 也 是 close () 方法 。 

















我 们 会 在 第 5 章 提供 更 多 和 上 下 文 管理 

















其 他 更 复杂 的 情况 最 好 使 用 上 下 文 管理 器 。 详 ! 
























































器 有 关 的 











CC 


青 请 看 第 5 章 “ 可 调用 对 象 和 上 下 文 的 使 用 ”， 


信息 











oO 


2.8 __new () 方 法 和 不 可 变 对 象 


__new_ 方 法 的 一 个 用 途 是 初始 化 不 可 变 对 象 。 new__() 方 法 中 允许 创建 未 初始 化 的 对 象 。 


























def 


我 们 试图 





下 面 是 当 我 们 试图 


下 面 是 一 个 错误 定义 的 类 ， 我 


class Float Fail( float ) : 




















init () 方法 被 调用 之 前 先 设置 对 象 的 属性 。 











变 类 的 ”init _() 方 法 很 难 重 载 ， 











super(). init ( value ) 


self.unit = unit 


init ( self, value, unit ): 


《不 合理 地 ) 初始 化 一 个 不 可 变 对 象 。 











>>> S2 = Float Fail( 6.5, "knots" ) 




















类 型 ， 也 有 类 似 的 问题 。 我 们 不 能 好 











_new ( 














= 


Traceback (most recent call 
File "<stdin>", 









































last): 























使 用 这 个 类 时 会 发 生 的 情况 。 


line 1, in <module> 









































忆 此 _new 方法 提供 了 一 种 扩展 这 种 类 的 方法 。 
门 定义 了 £1oat 的 一 个 包含 单位 信息 的 版 本 。 









































TypeError: float() takes at most 1 argument (2 given) 
可 以 看 到 ， 对 于 内 置 的 float 类 ， 我 们 不 能 简单 地 重 载 _init_ 方 法。 对 于 其 他 的 内 置 不 可 变 


















































E 不 可 变 对 象 self 上 设置 新 的 属性 值 ， 因 为 这 是 不 可 变性 的 定义 。 
我 们 只 能 在 对 象 创建 的 过 程 中 设置 属性 值 ， 对 象 创建 之 后 new__() 方法 就 会 被 调用 。 


















































) 方法 天 生 就 是 一 个 静态 方法 。 即 使 没有 使 用 @ staticmethod 修饰 符 ， 它 也 是 静态 的 。 
它 没有 使 用 self 变量 ， 因 为 它 的 工作 是 创建 最 终 会 被 赋值 给 self 变量 的 对 象 。 
































这 种 情况 下 ， 我 们 会 使 用 的 方法 签 
建 的 类 的 实例 。 
() 方 法 的 默认 实现 如 下 。 


return super(). new ( cls ) 将 调 月 














下 一 个 部 分 关于 元 类 3 


























名 是 _new _( cls，*args，**kw)。cls 变量 是 准备 创 









































型 的 例子 ， 会 比 这 里 展示 的 args 的 参数 序列 更 加 复杂 。 








日 基 类 的 ”new _() 方法 创建 对 象 。 这 个 工作 最 终 





委托 给 了 object. new ()， 这 个 方法 创建 了 一 个 简单 的 空 对 象 。 除 了 cls 以 外 ， 其 他 的 参数 和 
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关键 字 最 终 都 会 传递 给 ”init _() 方法， 这 是 Python 定义 的 标准 行为 。 
除了 有 下 面 的 两 个 例外 ， 这 就 是 我 们 期 望 的 行为 。 
@ 当 我 们 需要 继承 一 个 不 可 变 的 类 的 时 候 ， 我 们 会 在 后 面 的 部 分 详细 讲解 。 
@ 当 我 们 需要 创建 一 个 元 类 型 的 时 候 ， 这 是 下 一 个 部 分 的 主题 ， 因 为 它 与 创建 不 可 变 对 象 是 








完全 不 同 的 。 
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当 创 建 一 个 内 置 的 不 可 变 类 型 的 子 类 时 ， 不 能 重 载 _init _() 方 法 。 取而代之 的 是 ， 我 们 必须 
































通过 重 载 new _() 方法 在 对 象 创建 的 过 程 中 扩展 基 类 的 行为 。 下 例 是 扩展 float 类 的 正确 方式 。 
class Float Units( float ): 
def new ( cls, value, unit ): 
obj= super(). new ( cls, value ) 


obj.unit= unit 
return obj 

















下 面 的 代码 使 用 上 面 定义 的 类 创建 了 











上 面 的 代码 在 对 象 创建 的 过 程 中 设置 了 一 个 属性 的 值 。 



































个 带 单位 的 浮 点 数 。 








>>>speed= Float Units( 6.5, "knots™ ) 


>>>speed 
6.5 
>>>speed * 10 
65.0 

>>> speed.unit 
'knots' 











注意 ， 像 speed * 10 这 种 表达 式 不 会 创建 一 个 Float_Units 对 象 。 这 个 类 的 定义 继承 了 float 
































在 第 7 章 “ 创 建 数值 类 型 ”中 介绍 。 



































中 所 有 的 运算 符 ; float 的 所 有 算术 特殊 方法 也 都 只 会 创建 float 对象。 创建 Eloat_Units 对 象 会 


2.9 new ”0 方法 和 元 类 型 


new () 方 法 的 另 一 种 用 途 ， 作 为 元 类 型 的 一 部 分 ， 主要 是 为 了 控制 如 何 创建 一 个 类 。 这 和 
































之 前 的 如 何 用 new (控制 一 个 不 可 变 对 象 是 完全 不 同 的 。 
一 个 元 类 型 创建 一 个 类 。 一 旦 类 对 象 被 创建 ， 我 们 就 可 以 用 这 个 类 对 象 创建 不 同 的 实例 。 所 有 















































类 的 元 类 型 都 是 type，type () 函数 被 


来 创建 类 对 象 。 














另外 ，type () 函数 还 可 以 被 用 作 显 示 当 前 对 象 类 型 。 








下 面 是 一 个 很 简单 的 例子 ， 直 接 使 用 type () 作为 构造 器 创建 了 一 个 新 的 但 是 几乎 5 

















何 用 处 的 类 : 
Useless= type ("Useless", (),{}) 


旦 我 们 创建 了 这 个 类 ， 我 们 就 可 以 


























~ 
dt 


全 没有 任 




















开始 创建 这 个 类 的 对 象 。 但 是 ， 这 些 对 象 什么 都 做 不 了 ， 
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因为 我 们 没有 定义 任何 方法 和 属性 。 











为 了 最 大 化 利用 这 个 类 ， 在 下 面 的 例子 中 ， 我 们 使 用 这 个 新 创建 的 Useless 类 来 创建 对 象 。 


>>> Useless () 

< main .Useless object at 0x101001910> 
>>> u=_ 

>>> u.attr= 1 

>>> dir(u) 
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我 们 可 以 向 这 个 类 的 对 象 中 增加 属性 。 至 少 ， 作 为 一 个 对 象 ， 它 工作 得 很 好 。 





























这 样 的 类 定义 与 使 用 types.SimpleNamespace 或 者 像 下 面 这 样 定义 一 个 类 的 方式 几乎 相同 。 














class Useless: 
pass 


这 带 来 一 个 重要 的 问题 : 为 什么 我 们 一 开始 要 复杂 化 定义 一 个 类 的 方法 呢 ? 



































答案 是 ， 类 中 一 些 默 认 的 特性 无 法 应 用 到 一 些 特殊 的 类 上 。 下 面 ， 我 们 会 列举 4 种 应 该 使 用 元 





类 型 的 场景 。 




















@ 我 们 可 以 使 用 元 类 型 来 保留 一 个 类 源码 中 的 文本 信息 。 一 个 使 用 内 置 的 type 创建 的 类 型 会 使 用 






























































dict 来 存储 不 同 的 方法 和 类 级 属性 。 因 为 字典 是 无 序 的 ， 所 以 属性 和 方法 没有 特别 的 排列 顺序 。 





























所 以 极 有 可 能 这 些 信息 会 以 和 源码 中 不 同 的 顺序 出 现 。 我 们 会 在 第 1 个 例子 中 讲解 这 点 。 






































@ ”在 第 4~7 章 中 我 们 会 看 到 元 类 型 被 用 来 创建 抽象 基 类 。 一 个 











象 基 类 基于 


















































new ”0 方法 来 确 























定子 类 的 完整 性 。 在 第 4 章 “ 抽 象 基 类 设计 的 一 致 性 ”中 ， 我 们 会 介绍 这 点 。 
@ ”元 类 型 可 以 被 用 来 简化 对 象 序 列 化 的 某 些 方面 。 在 第 9 章 “ 序 列 化 和 保存 一 一 JSON、 






































YAML、Pickle、CSV 和 XML” 中 ， 我 们 会 详细 介绍 这 一 点 。 



































@ 作为 最 后 一 个 也 是 最 简单 的 例子 ， 我 们 会 看 看 一 个 类 中 对 自己 的 引用 。 我 们 会 设计 一 个 引 
用 了 master 类 的 类 。 这 不 是 一 种 基 类 一 子 类 的 关系 。 这 是 一 些 平行 的 子 类 ,但 是 引用 了 
这 些 子 类 中 的 一 个 作为 master。 为 了 和 它 平行 的 类 保持 一 致 ， 主 类 需要 包含 一 个 指向 自 



















































































2.9.1 元 类 型 示例 1 一 一 有 序 的 属性 

















身 的 引用 ， 如 果 不 用 元 类 型 ， 不 可 能 实现 这 样 的 行为 。 这 是 我 们 的 第 2 个 例子 。 


这 是 Python Language Reference 3.3.3 节 “ 自 定义 Python 的 类 创建 ”中 的 经 典 例子 ， 这 个 元 类 











型 会 记录 属性 和 方法 的 定义 顺序 。 
下 面 是 实现 的 3 个 具体 步骤 。 
1. 创建 一 个 元 类 型 。 元 类 型 的 _prepare () 和 new () 方 法 会 改变 日 
会 将 原本 的 dict 类 替换 为 orderedqDict 类 。 




















标 类 创建 的 方式 ， 
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2. 创建 一 个 基于 此 元 类 型 的 抽象 基 类 。 这 个 抽象 类 简化 了 其 他 类 继承 这 个 元 类 型 的 过 程 。 
3. 创建 一 个 继承 于 这 个 抽象 基 类 的 子 类 ， 这 样 它 就 可 以 获得 元 类 型 的 默认 行为 。 
下 面 是 使 用 该 元 类 型 的 例子 ， 它 将 保留 属性 创建 的 顺序 。 


import collections 






















































































class Ordered Attributes (type): 
@classmethod 
def prepare (metacls, name, bases, **kwds): 
return collections.OrderedDict () 
def new (cls, name, bases, namespace, **kwds): 





result = super(). new (cls, name, bases, namespace) 
result. order = tuplel(n for n in namespace if not 
n.startswith(' ')) 


return result 


这 个 类 用 ee () 和 _new__() 方 法 扩展 了 内 置 的 默认 元 类 型 type。 
prepare () 方 法 会 在 类 创建 之 前 执行 ， 它 的 工作 是 创建 初始 的 命名 空间 对 象 ， 类 定义 最 

后 被 添加 到 这 a 这 个 方法 可 以 用 来 处 理 任 何在 类 的 主体 开始 执行 前 需要 的 准备 工作 。 

_new _() 静态 方法 在 类 的 主体 被 加 入 命名 空间 后 开始 执行 。 它 的 参数 是 要 创建 的 类 对 象 、 类 
名 、 基 类 的 元 组 和 创建 好 的 命名 空间 匹配 对 象 。 这 个 例子 很 经 典 : 它 将 ”new _() 的 真正 工作 委托 
给 了 基 类 ; 一 个 元 类 型 的 基 类 是 内 置 的 type; 然后 我 们 使 用 type . new__() 创建 一 个 稍 后 可 以 
修改 的 默认 类 。 
这 个 例子 中 的 _new__() 方 法 向 类 中 增加 了 一 个 _order 属性 ， 用 于 存储 原始 的 属 ! 
当 我 们 定 义 ee 我 们 可 以 用 这 个 元 类 型 而 非 type。 


class Order Preserved!( metaclass=Ordered Attributes ) : 













































































































































































| 
I 





生 创建 顺序 。 



































pass 
然后 ， 我 们 可 以 将 这 个 新 的 抽象 基 类 作为 任何 其 他 自 定义 类 的 基 类 ， 如 下 所 示 。 


class Something( Order Preserved ) : 
this= 'text"' 
def z( self ) : 
return False 



































b= 'order is preserved' 
a= "more text' 


我 们 可 以 用 下 面 的 代码 来 介绍 Something 类 的 使 用 。 


>>> Something. order 
人 


我 们 可 以 考虑 利用 这 些 信 息 来 正确 序列 化 对 象 或 者 用 于 提供 原始 代码 定义 的 调试 信息 。 


2.9.2 元 类 型 示例 2 一 一 自 引 用 
接 下 来 ， 我 们 看 看 一 个 关于 单位 换算 的 例子 。 例 如 ， 长 度 单 位 包括 米 、 厘 米 、 英 寸 、 英 尺 和 许 
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多 其 他 的 单位 。 正 确 地 管理 单位 换算 是 非常 有 挑战 性 的 。 表面 上 看 ， 我 们 需要 一 个 表示 不 同 单位 间 
转换 因子 的 矩阵 。 例 如， 英尺 转换 为 米 、 英 尺 转 换 为 英寸 、 贡 尺 转 换 为 码 、 米 转换 为 英寸 、 米 转换 
为 码 等 可 能 的 组 合 。 

但 是 ， 在 实践 中 ,一 个 更 好 的 方案 是 定义 一 个 长 度 的 标准 单位 。 我们 可 以 把 任何 其 他 单位 转换 
为 标准 单位 ， 也 可 以 把 标准 单位 转换 为 任何 其 他 单位 。 通 过 这 种 方式 ， 我们 可 以 很 容易 地 将 单位 转 
换 变 成 一 致 的 两 步 操 作 ， 而 不 用 再 考虑 包含 了 所 有 可 能 转换 的 复杂 矩阵 : 英尺 转换 为 标准 单位 ， 英 
寸 转换 为 标准 单位 ， 码 转换 为 标准 单位 ， 米 转换 为 标准 单位 。 
在 下 面 的 例子 中 , 我 们 不 准备 继承 float 或 者 numbers .Number。 相 比 于 将 单位 和 数值 绑 定 
在 一 起 ， 我 们 更 倾向 于 允许 让 每 一 个 值 仅 仅 代 表 一 个 简单 的 数字 。 这 是 享 元 模式 的 一 个 例子 ， 类 中 
不 会 定义 包含 相关 值 的 对 象 ， 对 象 中 仅仅 包括 转换 因子 。 

另 一 种 方案 〈 将 值 和 单位 绑 定 ) 会 造成 需要 相当 复杂 的 三 围 分 析 。 虽 然 这 很 有 趣 ， 但 是 太 复 杂 了 。 

我 们 会 定义 两 个 类 : Unit 和 Standard_Unit 。 我 们 可 以 很 容易 保证 每 个 Unit 类 中 都 正确 
地 包含 一 个 指向 它 的 standarg_Unit 的 引用 。 但 是 , 我 们 如 何 能 够 保证 每 一 个 standard Unit 
类 中 都 有 一 个 指向 自己 的 引用 呢 ? 在 类 定义 中 实现 子 引用 是 不 可 能 的 ， 因 为 此 时 都 还 没有 定义 类 。 

下 面 是 我 们 的 Unit 类 的 定义 。 


class Unit: 







































































































































































































































































































































































































































































"WWFEUuUl11 name for the unit.™"" 
factor= 1.0 
standard= None # Reference to the appropriate StandardUnit 
name= "" # Abbreviation of the unit's name. 
@classmethod 
def value( class , value ): 

if value is None: return None 

return value/class .factor 
@classmethod 
def convert( class , value ) : 

if value is None: return None 

return value*class .factor 


这 个 类 的 目的 是 Unit .value () 可 以 将 一 个 值 从 给 定 的 单位 转换 为 标准 单位 , 而 Unit .convert () 
方法 可 以 将 一 个 值 从 标准 单位 转换 为 给 定 的 单位 。 
这 让 我 们 可 以 用 下 面 的 方式 转换 单 人 


>>> m f= FOOT.value (4) 
>>> METER.convert (m 工 ) 
4..2191.999.999.99.99.98 


创建 的 值 类 型 是 内 置 的 fl1oat 类 型 。 对 于 温度 的 计算 ， 我 们 需要 重 载 默认 的 value () 和 
convert () 方 法 ， 因 为 简单 的 乘法 运算 不 能 满足 实际 物 景 。 
对 于 standargd Unit， 我 们 可 能 会 使 用 下 面 这 样 的 代码 : 


class INCH: 
standard= INCH 





hon 










































































位 。 
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TheStandardgdU 


一 致 的 结构 能 够 帮助 我 位 


但 是 ， 这 段 代 码 无 效 。 
存在 的 。 
我 们 可 以 用 下 面 的 备用 方法 来 处 理 这 种 ! 


class INCH : 
Pass 


INCH.standard= INCH 





大 





为 INCH j 









































青 况 。 








但 是 ， 这 样 的 做 法 相当 丑陋 。 





我 们 还 可 以 像 下 面 这 相 


@standard 
class INCH: 
pass 


这 个 修饰 符 方法 可 以 用 来 向 类 定义 
我 们 再 详细 探讨 这 种 方法 
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定义 一 个 修饰 符 。 


加 入 一 个 属性 。 在 第 
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定义 在 INCH 类 中 。 在 完成 定义 之 前 ， 这 个 类 都 是 不 


“装饰 器 和 mixin 一 一 横 切 方面 ” 
































现在 ， 我 们 会 定义 一 个 可 以 向 类 定义 中 插入 一 个 循环 引用 的 元 类 型 ， 如 下 所 示 。 
class UnitMeta (type): 
def new (cls, name, bases, dict): 
new class= super(). new (cls, name, bases, dict) 
new class.standard = new class 


return new class 


这 段 代 码 强制 地 将 变量 standard 作为 类 定义 的 一 部 分 。 

















对 大 多 数 单位 ，SomeUnit.standard 引用 了 ThestanqardqUnit 类 。 类 似 地 ， 我 们 也 让 


























下 面 是 standard Unit 类 : 


class Standard Unit( U 


pass 
从 Unit 继承 的 单位 转换 因子 是 1.0， 所 以 它 并 没有 提 
这 样 它 就 会 有 自 引 用 ， 这 个 自 引 用 表明 这 个 类 是 这 一 特定 给 














作为 一 种 优 
































下 面 是 一 些 单 























nit, metaclass=UnitMeta 





























class INCH( 


"nnInchesnnn 


name= "in" 


class FOOT( 


Unit ):: 
wm "Feet mn 


name= "ft" 


standard= INCH 





nit.standard 引用 TheStandarqdUnit 类 。 Unit 和 standarqd Unit 类 之 间 这 种 
书写 文 要 和 自动 化 单位 转换 。 


) 








供 任何 值 。 它 包括 了 特殊 的 元 类 型 定义 ， 








度 的 测量 标准 。 




















化 的 手段 ， 我 们 可 以 重 载 value () 和 convert () 方法 来 禁止 乘法 和 除法 运算 。 
位 类 的 例子 。 


Standard Unit ) : 
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factor= 1/12 





class CENTIMETER( Unit ) : 


"nnCentimetersnnn 











name= "cm" 
standard= INCH 
factor= 2.54 


class METER( Unit ): 
wm "Meters mm 
name= "mn 
standard= INCH 


factor= .0254 





























我 们 将 INCH 定 为 标准 单位 ， 其 




















他 单位 需要 转换 成 英寸 或 者 从 英寸 转换 而 来 。 



































在 每 一 个 单位 类 中 ,我 们 都 提供 了 一 些 文档 信息 : 全 名 写 在 docstring 中 并 且 用 name 属 


















































录 缩 写 。 从 Unit 继承 而 来 的 convert () 和 value () 方法 会 自动 应 用 转换 因子 。 








有 了 这 些 类 的 定义 ， 我 们 就 可 以 在 程序 中 像 下 


>>> X stdq= INCH.value( 159.625 ) 


>>> FOOT.convert( x std ) 
13.302083333333332 

>>> METER.convert( x std ) 
4.054475 
>>> METER. factor 
0.0254 




















我 们 可 以 根据 给 定 的 英寸 值 设置 一 种 特定 的 测量 方式 并 且 可 以 将 该 值 转换 为 任何 兼容 的 





























>>> INCH.standard. name | 
'INCH' 
>>> FOOT.standard. name | 
"INCH' 
























































用 这 样 编码 。 





性 记 




















于 元 类 型 的 存在 ， 我 们 可 以 像 下 面 这 样 从 单位 类 中 查询 。 








这 种 引用 方式 让 我 们 可 以 追踪 


2.10 总结 





我 们 已 经 介绍 了 许多 基本 的 特殊 方法 ,它们 是 我 们 在 设计 任何 类 时 的 基本 特性 。 这 些 方 法 已 





个 指定 


E 度 上 的 不 同 六 














位。 









































包含 在 每 个 类 中 ， 只 是 它们 的 默认 行为 不 一 定 能 满足 我 们 的 需求 。 





我 们 几乎 总 是 需要 重 载 _repr 





()、 


str () 和 




















是 非常 有 用 








我 们 几乎 不 需要 重 载 bool _() 方 法， 除非 我 们 想 自 定义 集合 。 这 是 第 6 章 “ 创 建 容器 和 外 





合 ”的 主题 。 


format  ()。 这 些 方法 的 默认 实 于 
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但 是 不 适用 了 





























2.10 总 结 65 


我 们 常常 需要 重 载 比较 运算 符 和 hash () 方 法。 默认 的 实现 只 适合 于 比较 简单 不 可 变 对 象 ， 


比较 可 变 对 象 。 我 们 不 一 定 要 重 写 所 有 的 比较 运算 符 ， 在 第 8 章 “ 装 饰 器 和 mixin 一 





一 横 切 方面 ”中 ， 我 们 会 详细 介绍 functools. total ordering 修饰 符 。 


另外 两 个 较为 特殊 的 方法 _new 
_ new 
基本 的 特殊 方法 和 ”init  () 方 法 几乎 会 H 
j 途 ， 它 们 分 为 6 个 不 同 的 类 别 。 
属性 访问 : 这 些 特 殊 方 法 实现 的 是 表达 式 中 object .attribute 的 部 分 ， 


特殊 的 























() 和 _ del 




















() 来 扩展 不 可 变 类 型 。 

















个 赋值 语句 的 左 操作 数 以 及 del 语句 中 。 
可 调用 对 象 : 一 个 实现 了 将 函数 作为 参数 的 特殊 方法 ， 很 像 内 置 的 1en () 函数 。 
集合 : 这 些 特殊 方法 实现 了 集合 的 很 多 特性 ， 包 括 sequence [index]、mapping[index] 


和 set | set。 














现在 我 们 定义 的 所 有 类 





() 有 更 特殊 的 月 


日 途 。 






































。 其 他 的 特殊 方法 则 有 更 





大 多 数 情 况 下 ， 使 用 



































已 通常 用 























数字 : 这 些 特殊 方法 提供 了 算术 运算 符 和 比较 运算 符 。 我 们 可 以 














支持 的 数值 类 型 。 








上 下 文 : 有 两 个 特殊 方法 被 我 们 有 
迭代 器 : 有 一 些 特殊 方法 定义 了 一 个 迁 代 器 。 没 有 必要 一 定 要 使 
函数 很 好 地 实现 了 这 种 特性 。 但 是 ， 我 们 
在 下 一 章 中 ， 我 们 会 着 重 探讨 









































j 这些 方法 扩展 Python 








来 实现 可 以 和 with 语句 一 起 使 用 的 上 下 文 管理 器 。 
































大 





为 生成 器 











可 以 了 解 如 何 实现 














属性 、 特 性 和 修饰 符 。 














定义 的 迭代 器 。 


一 个 对 象 是 一 系列 功能 的 集合 ， 包 括 了 方法 和 















































































































































属性 。object 类 的 默认 行为 包括 设置 、 
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获取 和 


















































































































































删除 属性 。 可 以 通过 修改 这 些 默认 行为 来 决定 对 象 中 哪些 属性 是 可 用 的 。 

本 章 会 专注 于 有 关 属 性 访问 的 以 下 5 种 方式 。 

@ 内 部 集成 属性 处 理 方式 ， 这 也 是 最 简单 的 方式 。 

@ 重 温 @property 修饰 符 。 特 性 扩展 了 属性 的 概念 ， 包 含 了 方法 的 处 理 。 

@ ”使 用 底层 的 特殊 方法 来 控制 属性 的 访问 :_getattr ()、 setattr () 和 gdelattr ()。 

这 些 特殊 方法 会 简化 属性 的 处 理 过 程 。 

@ 使 用 _getattribute () 方 法 在 更 细 粒 度 的 层面 上 操作 属性 ， 也 可 以 用 来 编写 特殊 的 

属性 处 理 逻 辑 。 

@ 最 后 ， 会 介绍 一 些 修饰 符 。 它 们 用 于 属性 访问 ， 但 它们 的 设计 也 会 相对 复杂 些 。 修 饰 符 在 

Python 中 的 特性 、 静 态 方法 和 类 方法 中 被 广泛 使 用 。 

本 章 会 具体 介绍 默认 方法 ， 我 们 需要 知道 在 什么 情况 下 需要 重 写 这 些 默 认 行为 。 在 一 些 情形 下 ， 
需要 使 用 属性 完成 一 些 不 仅仅 是 一 个 实例 变量 能 够 完成 的 工作 。 在 其 他 情况 下 , 我 们 可 能 需要 禁止 属 
性 的 添加 ， 也 可 能 在 一 些 场景 需要 创建 逻辑 更 为 复杂 的 属性 。 

正如 我 们 研究 修饰 符 那 样 ， 我 们 会 从 Python 内 部 的 工作 机 制 入 手 。 我 们 不 会 经 常 显 式 地 使 用 
修饰 符 ， 而 是 隐 式 地 使 用 它们 。 在 Python 中 ， 修 饰 符 能 够 被 用 来 完成 很 多 功能 。 

3.1 属性 的 基本 操作 

默认 情况 下 ， 创 建 任何 类 内 部 的 属性 都 将 支持 以 下 4 种 操作 。 

@ 创建 新 属性 。 

@ 为 已 有 属性 赋值 。 

@ ”获取 属性 的 值 。 

@ 删除 属性 














3.1 ”属性 的 基本 操作 67 

































































我 们 可 以 使 用 如 下 简单 的 代码 来 对 这 些 操作 进行 测试 ， 创 建 一 个 简单 的 泛 型 类 并 将 其 实例 化 。 


>>> class Generic: 


pass 


>>> g= Generic() 

















以 上 代码 允许 我 们 创建 、 获 取 、 赋 值 和 删除 属性 。 我 们 可 以 容易 地 创建 和 获取 一 个 属性 ， 以 下 
是 一 些 例子 。 
>>> g.attribute= "value" 


>>> g.attribute 


"Value' 





>>> g.unset 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: 'Generic' object has no attripbute ‘unset' 
>>> del g.attribute 
>>> g.attribute 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 





AttributeError: 'Generic' object has no attribute "attribute' 

我 们 可 以 添加 、 修 改 和 删除 属性 。 如 果 试 图 获取 一 个 未 赋值 的 属性 或 者 删除 一 个 不 存在 的 属性 
则 会 抛 出 异常 。 

另 一 种 更 好 的 办 法 是 从 types .SimpleNamepace 类 创建 实例 。 此 时 不 需要 额外 定义 一 个 新 类 ， 
就 能 实现 同样 的 功能 。 我 们 可 以 像 如 下 代码 这 样 创建 SimpleNamespace 类 的 对 象 。 


>>> import types 










































































>>> n = types.SimpleNamespace() 


在 如 下 代码 中 ， 可 以 看 到 使 用 simpleNamespace 类 能 够 完成 同样 的 任务 。 


>>> n.attribute= "value" 
>>> n.attribute 

'value' 
>>> del n.attribute 

>>> n.attribute 

Traceback (most recent call last): 























File "<stdin>", line 1, in <module> 








AttributeError: 'namespace' object has no attribute 'attribute' 


我 们 可 以 为 这 个 对 象 添 加 属性 ,试图 获取 任何 一 个 未 定义 的 属性 将 会 引发 异常 。 比 起 我 们 之 前 
看 到 的 ， 使 用 创建 opject 类 实例 的 实现 方式 ， 使 用 simpleNamespace 类 的 做 法 会 略 有 不 同 。 
object 类 的 实例 不 允许 创建 新 属性 ， 因 为 它 缺 少 Python 内 部 用 来 存储 属性 值 的 _aict_ 结构 。 


特性 和 init_0 方 法 
大 多 数 情 况 ， 我 们 使 用 类 的 _init _() 方法 来 初始 化 花色 特 必 


































































































让 


























里 想 情况 下 ， 可 以 在 _init _() 
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方法 中 提供 所 有 属性 的 默认 值 。 
而 在 _init __() 方 法 中 没 必要 为 所 有 的 属性 赋值 。 基 于 这 样 的 考虑 ,一 个 特性 的 存在 与 否 就 构 
成 了 对 象 状态 的 一 部 分 。 
可 选 特性 更 好 地 完善 了 类 定义 , 它 使 得 特性 在 类 的 定义 中 发 挥 了 很 大 的 作用 。 特性 通常 可 以 根 
据 类 层次 结构 进行 选择 性 的 添加 (或 删除 )。 
忆 此 , 可 选 特性 隐藏 了 一 种 非 正 式 的 子 类 关系 。 当 使 用 可 选 特性 时 , 要 考虑 到 对 多 态 性 的 影响 。 
在 21 点 游戏 中 ， 需 要 考虑 这 样 的 规则 : 只 允许 发 牌 一 次 。 即 如 果 已 经 发 牌 了 ， 就 不 能 再 次 发 
牌 。 我 们 可 以 考虑 用 以 下 几 种 方式 来 实现 。 

@ 基于 Hand.split 方法 提出 一 个 子 类 ， 并 将 其 命名 为 SplitHangd, 在 这 里 省 略 该 类 的 具 
体 实 现 。 
@ 也 可 以 为 Hand 对 象 创建 一 个 status 属性 ， 其 值 可 以 从 Hand.split () 方 法 i 

类 型 为 布尔 型 ， 但 是 我 们 也 可 以 考虑 把 它 实 现 为 可 选 属性 。 
以 下 是 Hand.split () 函数 的 一 种 实现 方式 ， 通 过 可 选 属性 来 检测 并 阻止 多 次 发 牌 的 操作 。 
def split( self, deck ) : 


assert self.cards[0] .rank == self.cards[1] .rank 
try 
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self.split count 
raise CannotResplit 

except AttributeError: 
ho = Hand( self.dealer card, self.cards[0], deck.pop() ) 
hl = Hand( self.dealer card, self.cards[1], deck.pop() ) 
h0O.split count= hil.split count= 1 
return h0, hil 























事实 上 ，split () 方法 的 逻辑 仅仅 是 检查 是 否 已 存在 split_count 属性 。 如 果 属 性 存在 ， 则 判 
断 为 多 次 分 牌 操 作 并 抛 出 异常 ;如果 split_count 属性 不 存在 ， 说 明 这 是 第 1 次 发 牌 ， 就 是 允许 的 。 

使 用 可 选 属性 的 一 个 好 处 是 使 得 ”init _() 方 法 看 起 来 相对 整洁 了 一 些 , 不 好 的 地 方 在 于 它 隐 
藏 了 一 些 对 象 的 状态 。 对 于 try 语句 的 这 种 使 用 方式 (检测 对 象 属性 是 否 存 在 , 存在 则 抛 出 异常 )， 
很 容易 造成 困惑 而 且 应 该 避免 使 用 。 


3.2 创建 特性 


特性 是 一 个 函数 ， 看 起 来 〈 在 语法 上 ) 就 是 一 个 简 身 
值 ， 正 如 我 们 可 以 获取 、 设 置 和 删除 属性 值 。 这 里 有 一 个 
被 调用 ， 而 不 仅仅 是 用 于 存储 的 对 象 的 引用 。 

除了 复杂 程度 ， 特 性 和 属性 的 另 一 个 区 别 在 于 ， 我 们 不 能 轻易 地 为 已 有 对 象 添 加 新 特性 。 但 
是 默认 情况 下 ， 我 们 可 以 很 容易 地 给 对 象 添 加 新 属性 。 在 这 一 点 上 ， 特 性 和 属性 有 很 大 区 别 。 

可 以 用 两 种 方式 来 创建 特性 。 我 们 可 以 使 用 aproperty 修饰 符 或 者 使 用 property () 函数 。 
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的 属性 。 我 们 可 以 获取 、 设 置 和 删除 特性 


要 的 区 别 : 特性 是 一 个 函数 ， 而 且 可 以 
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它们 只 是 语法 不 同 。 我 们 会 详细 介绍 使 用 修饰 符 的 方式 。 
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我 们 先 看 一 下 关于 特性 的 两 个 基本 设计 模式 。 

@ ”主动 计算 (Eager Calculation): 每 当 更 新 特性 值 时 , 其 他 相关 特性 值 都 会 立即 被 重新 计算 。 
@ 延迟 计算 (Lazy calculation): 仅 当 访问 特性 时 ， 才 会 触发 计算 过 程 。 

为 了 对 比 这 两 种 模式 ， 我 们 会 把 Hand 对 象 的 一 些 公共 逻辑 提 到 抽象 基 类 中 ， 如 以 下 代码 所 示 。 



















































































class Hand: 
def str ( self ): 
return ", ".join( mapl(str, self.card) ) 
def repr ( self ): 
return "{_ class . name }({dealer cardl!lr}, {_ cards str})". 





format ( 
class =self. class , 





_Ccards str=", ".join( map(repr, self.card) ), 

**self. dict  ) 
以 上 代码 的 逻辑 只 是 定义 了 一 些 字符 串 的 表示 方法 。 在 下 面 代码 中 定义 了 Hand 类 的 子 类 , 其 
otal 属性 的 实现 方式 使 用 了 延迟 计算 模式 。 


class Hand Lazy (Hand): 
def init ( self, dealer card, *cards ) : 









































self.dealer card= dealer card 
self. cards= list (cards) 
@property 
def totall( self ) : 
delta soft = max(c.soft-c.hard for c in self. cards) 
hard total = sum(c.hard for c in self. cards) 
if hard totalt+delta soft <= 21: return hard totalt+delta soft 
return hard total 
@property 
def card( self ) : 
return self. cards 
@card.setter 
def card( self, aCard ) : 
self. cards.append( aCard ) 
@card.deleter 
def cardl( self ) : 
self. cards.pop(-1) 


Hand_Lazy 类 使 用 了 一 个 cards 对 象 的 集合 来 初始 化 Hand 对 象 。 其 中 total 特性 被 定义 


















































为 一 个 方法 , 仅 当 被 调用 时 才 会 计算 总 值 。 另 外 ,也 定义 了 一 些 其 他 特性 来 更 新 手中 的 纸牌 。card 
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生 可 以 用 来 获取 、 设 置 或 删除 手中 的 牌 ， 我 们 会 在 特性 的 setter 和 deleter 部 分 介绍 它们 。 
























































我 们 可 以 创建 一 个 Hand 对 象 ，total 看 起 来 就 是 一 个 简单 的 属性 。 


>>> d= Deck() 
>>> h= Hand Lazy( d.pop(), d.pop(), d.pop() ) 
>>> hn.total 
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>>> h.card= d.pop() 


>>> nh.total 























































































































































































































29 
当 每 次 获取 总 值 时 ， 都 会 重新 扫描 每 张 牌 并 完成 延迟 计算 ， 这 个 过 程 也 是 非常 耗 时 的 。 
— 
3.2.1 主动 计算 特性 
以 下 是 Hand 类 的 子 类 ， 其 中 的 total 属性 的 实现 方式 为 主动 计算 ， 每 当 有 新 牌 添加 时 ，total 
属性 值 都 会 被 重新 计算 。 
class Hand FEager (Hand): 
def init ( self, dealer card, *cards ) : 
self.dealer card= dealer card 
self.total= 0 
self. delta soft= 0 
self. hard total= 0 
self. cards= list() 
for ce Tn Cards: 
self.card = c 
@property 
def card( self ) : 
return self. cards 
@card.setter 
def card( self, aCard ) : 
self. cards.append (aCard) 
self. delta soft = max(aCard.soft-aCard.hard, 
self. delta soft) 
self. hard total += aCard.hard 
self. set total() 
@card.deleter 
def card( self ) : 
removed= self. cards.pop(-1) 
self. hard total -= removed.hard 
# Issue: was this the only ace? 
self. delta soft = max( c.soft-c.hard for c in self. cards 
) 
self. set total() 
def set totall( self ) : 
if self. hard total+self. delta soft <= 21: 
self.total= self. hard total+self. delta soft 
else: 
self.total= self. hard total 
每 当 有 新 牌 添加 时 ，total 属性 值 都 会 被 更 新 。 
在 card 特 | 生 的 deleter 中 也 需要 相应 维护 total 值 的 更 新 , 即 每 当 牌 被 移 除 时 也 会 触发 total 
属性 值 的 计算 过 程 。 关 于 deleter 的 内 容 将 会 在 下 一 部 分 中 具体 介绍 
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有 关 对 Hand 类 的 两 个 子 类 (Hang Lazy () 和 Hand _ Eager () ) 的 调用 代码 逻辑 是 类 似 的 。 

d= Deck () 

hl= Hand Lazy( d.pop(), d.pop(), d.pop() ) 

print( hl.total ) 

h2= Hand Eager( d.pop(), d.pop(), d.pop() ) 

print( h2.total ) 

两 种 情况 下 ， 客 户 端 都 只 需 使 用 total 属性 (不 需要 关心 内 部 实现 )。 

使 用 特性 的 好 处 是 ， 每 当 特 性 内 部 实现 改变 时 调用 方 无 需 更 改 。 使 用 getter 和 setter 方 
法 也 可 达到 类 似 的 日 的 。 然 而 ，getter 和 setter 方法 需要 使 用 额外 的 语法 来 实现 。 以 下 是 两 个 
例子 ， 其 中 一 个 使 用 了 setter 方法 ， 而 另 一 个 则 是 使 用 了 赋值 运算 符 。 


obj.set something(value) 



















































































obj.something = value 

于 使 用 赋值 运算 符 〈=) 实现 方式 的 代码 意图 会 更 显然 一 些 ， 因 此 许多 程序 员 会 更 倾向 于 使 
用 这 种 方式 。 

3.2.2 setter 和 deleter 特性 


在 之 前 的 例子 中 ， 我 们 使 用 card 特性 来 处 理 从 牌 对 象 到 Hand 对 象 的 构造 过 程 。 
于 setter (和 deleter) 特性 是 基于 getter 属性 创建 的 ， 因 此 先 要 使 用 如 下 代码 定义 一 个 
getter 特性 。 








































































































CNY 
































@property 
def card( self ) : 

return self. cards 
Qcard.setter 
def card( self, aCard ) : 

self. cards.append( aCard ) 
Qcard.deleter 
def card( self ) : 

self. cards.pop(-1) 


可 以 简单 地 使 用 如 下 代码 完成 发 牌 。 
h.card= d.pop() 


以 上 代码 有 一 个 缺陷 ， 看 起 来 像 是 使 用 一 张 牌 来 蔡 换 所 有 的 牌 。 另 外 ， 它 更 新 了 可 变 对 象 的 状 
。 可 以 使 用 _iadg _() 特殊 方法 来 使 实现 更 简洁 。 我 们 会 在 第 7 章 “ 创 建 数值 类 型 ”中 详细 介绍 




























































































































































































对 于 当前 示例 , 虽 没 有 明确 的 理由 需要 使 用 deleter 特性 , 仍 可 以 使 用 它 来 做 一 些 其 他 事情 。 
我 们 可 以 使 用 它 来 移 除 最 后 一 张 被 处 理 的 牌 ， 这 可 以 作为 分 牌 过 程 的 一 部 分 。 
可 以 考虑 使 用 如 下 代码 作为 split () 的 一 个 实现 版 本 。 


def split( self, deck ) : 
"""Updates this hand and also returns the new hand."™"" 
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assert self. cards[0] .rank == self. carqs [1] .zank 

cl= self. cards[-1] 

del self.card 

self.card= deck.pop() 

h new= self. class ( self.dealer card, cl, deck.pop() ) 


return h new 


在 以 上 代码 所 示 的 函数 中 ， 修 改 了 传 入 的 Hand 对 象 并 返回 了 新 的 Hand 对 象 ， 以 下 是 分 牌 的 过 程 。 


























>>> d= Deck() 

>>> c= d.pop() 

>>> h= Hand Lazy( d.pop(), c, cc ) # Force splittable hand 

>>> h2= h.split (gd) 

>>> print (h) 

24, 10% 

>>> print (h2) 

24, A 

旦 有 两 张 牌 ， 就 可 以 使 用 split () 函数 实现 分 牌 并 返回 一 个 新 的 Hang 对 象 。 相 应 的 ， 一 

张 牌 会 从 初始 的 Hand 对 象 中 移 除 。 
这 个 版 本 的 split () 函数 是 有 效 的 。 然 而 ， 直 接 使 用 split () 函数 返回 两 个 新 的 Hand 对 象 

会 更 好 一 些 。 而 对 于 分 牌 前 的 Hang 对 象 ， 可 以 使 用 备忘录 模式 来 存放 一 些 统计 的 数据 。 


3.3 使 用 特殊 方法 完成 属性 访问 


本 节 将 介绍 3 个 用 于 属性 访问 的 标准 函数 : getattr _()、 setattr () 和 gelattr ()。 
此 外 , 还 可 以 用 qir _() 函数 来 查看 属性 的 名 称 。 下 一 部 分 会 介绍 getattribute _() 函数 的 使 用 。 
关于 属性 ， 之 前 章节 中 介绍 了 如 下 的 几 种 默认 操作 。 
@ setattr () 函数 用 于 属性 的 创建 和 赋值 。 
__getattr __() 函数 可 以 用 来 做 两 件 事 。 首 先 ， 如 果 属 性 已 经 被 赋值 ，_getattr __() 则 不 会 
被 调用 ， 直 接 返 回 属性 值 即 可 。 其 次 ， 如 果 属 性 没有 被 赋值 ， 那 么 将 使 用 _getattr __() 函数 
的 返回 值 。 如 果 找 不 到 相关 属性 ， 要 记得 抛 出 AttributeError 异常 。 
_ qdelattr () 函数 用 于 删除 属性 。 
_ dir _() 函数 用 于 返回 属性 名 称 列表 。 
_getattr _ () 函 数 只 是 复杂 逻辑 中 的 一 个 小 步骤 而 已 ， 仅 当 属 性 未 知 的 情况 下 它 才 会 被 使 
用 。 如 果 属 性 已 知 ， 这 个 函数 将 不 会 被 使 用 。 setattr () 函数 和 ”qdelattr () 函数 没有 内 部 
的 处 理 过 程 ， 也 没有 和 其 他 函数 逻辑 有 交互 。 
关于 控制 属性 访问 的 设计 ， 可 以 有 很 多 选择 。 基 于 这 3 个 基本 的 设计 出 发 点 : 扩展 、 封 装 和 创 
建 ， 以 下 是 具体 描述 。 
@ 扩展 类 。 通 过 重 写 _setattr () 和 delattr () 函数 使 得 它 几乎 是 不 可 变 的 。 也 可 









































































































































































































































































































































































































































































































































3.3 ”使 用 特殊 方法 完成 属性 访问 73 


以 使 用 slots 蔡 换 内 部 的 ”qict 对 象 。 
@ 封装 类 。 提 供 对 象 〈 或 对 象 集合 ) 属性 访问 的 代理 实现 。 这 可 能 需要 完全 重 写 和 属性 相关 
的 那 3 个 函数 。 
创建 类 并 提供 和 特性 功能 一 样 的 函数 。 使 用 这 些 方法 来 对 特性 逻辑 集中 处 至 
创建 延迟 计算 属性 ， 仅 当 需 要 时 才 触 发 计算 过 程 。 对 于 一 些 属 性 ， 它 的 值 可 能 来 自 文件 、 
数据 库 或 网 络 。 这 是 _getattr () 函数 的 常见 用 法 。 
@ 创建 主动 计算 属性 ， 其 他 属性 更 新 时 会 相应 地 更 新 主动 计算 属性 的 值 ， 这 是 通过 重 写 
setattr () 函数 实现 的 。 
我 们 不 必 对 以 上 各 项 逐一 讨论 。 我 们 只 会 详细 看 一 下 其 中 两 种 最 常用 的 : 扩展 和 封装 。 我 们 会 

创建 不 可 变 对 象 并 看 一 些 其 他 有 关 实 现 提 前 属性 的 方式 。 


3.3.1 使 用 _slots_ 创 建 不 可 变 对 象 


如 果 一 个 属性 是 不 允许 被 赋值 或 创建 的 ， 就 被 称 为 不 可 变 的 。 以 下 代码 演示 了 我 们 所 期 望 和 
Python 的 一 种 交互 方式 。 


>>> c= card21(1,'®') 
>>> c.rank= 12 




































































o 


HH 




































































































































































Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
File "<stdin>", line 30, in setattr 
TypeError: Cannot set rank 

>>> c.hack= 13 


Traceback (most recent call last): 








File "<stdin>", line 1, in <module> 
File "<stdin>", line 31, in setattr 
AttributeError: 'Ace2lCard' has no attribute "hack'" 


以 上 代码 中 ， 我 们 不 能 对 当前 对 象 属性 的 值 进行 修改 。 
需要 相应 对 类 的 定义 做 两 处 修改 。 在 以 下 代码 中 ， 我 们 仅 关 注 与 对 象 不 可 变相 关 的 3 个 部 分 。 


class BlackJackCard: 
"""Abstract Superclass""" 












































_slots = ( 'rank', 'suit', '‘'hard', 'soft"' ) 

def init ( self, rank, suit, hard, soft ) : 
super(). setattr ( 'rank', rank ) 
super(). setattr ( 'suit', suit ) 
super(). setattr ( 'hard', hard ) 
super(). setattr ( 'soft', soft ) 


def _ str ( self ): 
return "{0.rank}{0.suit}".format( self ) 
def setattr ( self, name, value ): 
raise AttributeError( "'{ class . name }' has no 





attribute '{name}'".format( _ class = self. class , name= name 


) ) 
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我 们 做 了 如 下 3 处 明显 的 修改 。 

@ 把 _slots 设 为 唯一 被 允许 操作 的 属性 。 这 会 使 得 对 象 内 部 的 _qict 对象 不 再 有 效 并 

阻止 对 其 他 属性 的 访问 。 

在 ”setattr _ () 函数 中 ， 代 码 逻 辑 仅仅 是 抛 出 异常 。 

在 _init () 函数 中 , 调用 了 基 类 中 ”setattr () 实现 ， 为 了 确保 当 类 没有 包含 有 效 
的 _setattr () 函数 时 ， 属 性 依然 可 被 正确 赋值 。 

如 果 需 要 ， 也 可 以 像 如 下 代码 绕 过 不 可 变 对 象 。 


object. setattr (c, 'bad', 5) 















































































































































这 会 引发 一 个 问题 。“ 如 何 阻止 恶意 程序 员 绕 过 不 可 变 对 象 ? ”这 样 的 问题 是 思春 的 。 我 们 永 




















远 无 法 阻止 恶意 程序 员 的 行为 。 另 一 个 同样 思春 的 问题 是 ,“ 为 什么 一 些 恶意 程序 员 会 试图 绕 过 对 
象 的 不 可 变性 ? ”当然 ， 我 们 无 法 阻止 恶意 程序 员 做 恶意 的 事情 。 






























































如 果 一 个 程序 员 不 喜欢 一 个 类 的 不 可 变性 ， 他 们 可 以 修改 它 并 移 除 重 定义 过 的 _setattr_ _() 














函数 。 一 个 类 似 的 例子 是 : 对 _hash _() 来 说 ,不 可 变 对 象 的 目的 是 能 够 返回 一 致 的 值 而 非 阻 止 



































程序 员 写 糟糕 的 代码 。 


~ 不 要 误解 _slots 
QQ slots 的 主要 目的 是 通过 限制 属性 的 数量 来 节约 内 存 。 


3.3.2 ”使 用 tuple 子 类 创建 不 可 变 对 象 




















我 们 也 可 以 通过 让 Card 特性 成 为 tuple 类 的 子 类 并 重 写 _getattr () 函数 来 实现 一 个 不 








可 变 对 象 。 这 样 一 来 ， 我 们 将 把 对 _getattr__ (name) 的 访问 转换 为 对 self[inqex] 的 访问 。 

















正如 我 们 在 第 6 章 “ 创 建 容器 和 集合 ”中 会 看 到 的 , self[index] 被 实现 为 ”getitem (index)。 

















以 下 是 对 内 部 tuple 类 的 一 种 扩展 实现 。 


class BlackJackCard2( tuple ): 
def new ( cls, rank, suit, hard, soft ): 
return super(). new ( cls, (rank, suit, hard, soft) ) 
def getattr ( self, name ) : 
return selfl[{'rank':0, ‘'suit':1], ‘'hard':2 ， 
'soft':3} [name]] 
def setattr ( self, name, value ) : 
raise AttributeError 


在 以 上 代码 中 ， 只 抛 出 了 异常 而 并 未 包含 异常 的 详细 错误 信息 。 
可 以 按照 如 下 代码 这 样 使 用 这 个 类 。 


>>> d = BlackJackCard2( 'A', '', 1, 11 ) 
>>> d.rank 
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+ 
> 
1 如/ 
>>> d.bad= 2 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


File "<stdin>", line 7, in setattr Attribute 





Error 


























尽管 无 法 轻易 改变 纸牌 的 面值 ， 但 是 我 们 仍 可 通过 操作 a. adict 来 引入 其 他 属性 


EE 
Py 























不 可 变性 真 的 有 必要 吗 ? 
红 《 为 确保 一 个 对 象 没有 被 误 用 可 能 需要 非常 多 的 工作 量 。 实际 上 ， 比 
太一。 起 构建 一 个 非常 安全 的 不 可 变 类 ， 我 们 更 关心 的 是 如 何 通过 异常 
抛 出 的 诊断 信息 来 进行 错误 追踪 。 





3.3.3 ”主动 计算 的 属性 


可 以 定义 一 个 对 象 ， 当 其 内 部 一 个 值 发 生变 化 时 ， 相 关 的 属性 值 也 会 立刻 更 新 。 这 种 及 时 更 新 

属性 值 的 方式 使 得 计算 结果 在 访问 时 无 需 再 次 计算 ， 从 而 优化 了 属性 访问 的 过 程 。 

我 们 可 以 定义 许多 这 样 特性 的 setter 来 达到 此 目的 。 然 而 ， 如 果 有 很 多 特 

多 个 与 之 相关 的 属性 值 ， 这 样 做 有 时 又 是 多 余 的 。 

我 们 可 以 对 有 关 属 性 的 操作 集中 处 理 。 以 下 例子 中 ， 会 对 Python 的 内 部 aict 类 型 进行 扩展 。 这 

音 做 的 好 处 在 于 , 可 以 和 字符 串 的 format () 函数 很 好 地 配合 而且, 无 需 担心 不 必要 的 属性 赋值 操作 。 
如 下 代码 演示 了 所 希望 的 交互 方式 。 








































































































性 setter， 每 个 setter 


改 
疯 
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下 
于 
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>>> RateTimeDistance( rate=5.2, time=9.5 ) 

{'distance': 49.4, 'time': 9.5, 'rate': 5.2} 

>>> RateTimeDistance( distance=48.5, rate=6.1 ) 
{'distance': 48.5, 'time': 7.950819672131148, 'rate': 6.1} 

































































可 以 在 RateTimeDistance 对 象 中 设置 必需 的 属性 值 。 至 于 其 他 属性 值 ， 可 以 当 所 需 数据 被 提供 


时 再 计算 。 可 以 像 以 上 代码 演示 的 那样 , 一 次 性 完成 赋值 过 程 , 也 可 以 按照 以 下 代码 这 样 分 多 次 完成 赋值 。 





















































>>> rtd= RateTimeDistance() 
>>> rtd.time= 9.5 

> pe 

{'time': 9.5} 

>>> rtd.rate= 6.24 

> pd 


{'distance': 59.28, 'time': 9.5, '‘'rate': 6.24} 























以 下 代码 对 内 部 的 dict 进行 了 扩展 。 扩展 了 dict 的 基本 映射 功能 ， 加 入 了 对 缺失 
辑 处 理 。 








性 的 逻 


el 
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class RateTimeDistance( dict ) : 


def _ init 
super () . 
self. 


def _ getattr ( 
return self.get (name,None) 
def setattr ( 
self[name]= value 


self. 


def 


_solve() 
ir ( self 
return 1ist (se 


_solve() 


self, name ): 


( self, *args, **kw ): 
Nit si(" HargSy kW 


self, name, value 


hs 
lf.keys()) 





def solve (self): 
if self.rate is not None and self.time is not None: 


号 人 由 生 [总 


distance'] = self.rate*self.time 


elif self.rate is not None and self.distance is not None: 


self[' 


time'] = self.distance / self.rate 


elif self.time is not None and self.distance is not None: 











dict 类 型 使 用 











setattr _() 


self[' 


_init _() 


rate'] = self.distance / self.time 

















方法 完成 字典 值 的 填充 ， 然 后 


ta 











名 断 是 否 提供 了 足够 的 初始 化 数据 。 它 












































函数 来 为 字典 添加 新 项 ， 每 当 
函数 中 ， 使 用 None 


让 





属性 的 赋值 操作 发 生 时 就 会 调用 solve () 函数 。 























来 标识 属性 值 的 缺失 。 对 于 未 赋值 的 属性 ， 可 以 使 用 






































None 标记 为 缺失 的 值 ， 这 样 会 强制 对 这 个 值 进行 查找 。 例 如 ， 属 性 值 来 自用 户 输入 或 网 络 传输 


的 数据 ， 








>>> print( 
Ed Ye 
Rate=6.3, 





只 有 一 个 变量 值 


>>> rtd= RateTime 




















Distance 人 
"Rate={rate}, 






































为 None 而 其 他 变量 都 有 值 。 此 时 我 们 可 以 这 样 操 作 。 











Time=8.25, Distance=51.975 


主意 ， 我 们 不 和 


考虑 如 下 这 行 代 码 的 实现 。 


= self.rate*self.time 


self.distance 


如 果 编 写 了 以 上 代码 ， 























模型 

















且 3 个 属 


在 不 改变 aistance 的 情况 下 , 不 能 通过 
J 做 适度 调整 ， 清 空 一 个 变量 的 同时 为 男 一 个 变量 赋值 。 


>>> rtd.time= 





装 


会 造成 ”setattr 


被 赋值 ， 对 象 的 灵活 性 会 下 降 ， 


























None 


>>> rtd.rate= 6.1 


>>> print( 


"Rate={rate}, 








Time={time}, 











) 函数 和 _solve () 
之 前 演示 的 self ['distance'] 方 式 ， 就 可 有 效 地 避免 _setattr _() 











rate=6.3, time=8.25, distance=None ) 
Distance={dqistance}" .format ( 


EB 轻易 地 在 类 定义 的 内 部 对 属性 赋值 。 























Er 


函数 之 间 的 无 限 递归 调用 。 本 
函数 的 递归 调用 。 











了 解 这 一 点 也 是 很 重要 的 。 





寸 对 rate 赋值 ， 从 而 计算 出 time 的 值 。 现 在 对 这 个 























Time={time}，Distance={dqistance}" .format ( 
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eh ke Bl 
Rate=6.1, Time=8.25, Distance=50.324999999999996 


以 上 代码 中 ， 为 了 使 上 ime 可 以 使 用 distance 既定 的 值 ， 清 空 了 time 并 修改 了 rate。 
可 以 设计 一 个 模型 ,追踪 变量 的 赋值 顺序 ， 这 个 模型 可 以 帮助 来 解决 这 样 的 情景 。 为 了 计算 结 
果 的 正确 性 ， 在 为 另 一 个 变量 赋值 之 前 ， 不 得 不 先 清空 一 个 变量 。 













































































3.4 ”getattribute (方法 




















__getattribute () 方 法 提供 了 对 属性 更 底层 的 一 些 操作 。 默 认 的 实现 逻辑 是 先 从 内 部 的 
qict (或 _slots ) 中 查找 己 有 的 属性 。 如 果 属 性 没有 找到 则 调用 getattr () 函数 。 

如 果 值 是 一 个 修饰 符 ( 参 见 3.5 节 “ 创 建 修 饰 符 ”)， 对 修饰 符 进行 处 理 。 否 则 ， 返 回 当 前 值 即 可 。 
通过 重 写 这 个 方法 ， 可 以 达到 以 下 目的 。 
@ 可 以 有 效 阻止 属性 访问 。 在 这 个 方法 中 ， 抛 出 异常 而 非 返 回 值 。 相 比 于 在 代码 中 仅仅 使 用 

下 划 线 (_) 为 开头 来 把 一 个 名 字 标 记 为 私有 的 方式 ， 这 种 方法 使 得 属性 的 封装 更 透彻 。 
@ 可 仿照 _getattr _() 峭 数 的 工作 方式 来 创建 新 属性 。 在 这 种 情况 下 ， 可 以 绕 过 
_ getattripute () 的 实现 逻辑 。 
可 以 使 得 属性 执行 单独 或 不 同 的 任务 。 但 这 样 会 降低 程序 的 可 读 性 和 可 维护 性 ， 这 是 个 很 
草 糕 的 想法 。 
可 以 改变 修饰 符 的 行为 。 虽 然 技 术 上 可 行 ， 改 变 修饰 符 的 行为 却 是 个 糟糕 的 想法 。 

当 实 现 _getattribute _() 方 法 时 ， 将 阻止 任何 内 部 属性 访问 函数 体 ， 这 一 点 很 
果 试 图 获取 self .name 的 值 ， 会 导致 无 限 递归 。 


| 


为 了 获得 _getattribute _() 方 法 中 的 属性 值 ， 必 须 显 式 调 
下 代码 这 样 。 


object. getattribute (self, name) 
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本 9etattribute _() 函数 不 能 包含 任何 self .name 属性 的 
从 一。 访问 ， 因 为 会 导致 无 限 递归 。 
























































的 方法 ， 像 如 


] ob ject 基 类 
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可 以 通过 使 用 _getattribute () 方 法 阻止 对 内 部 gict_ 属性 的 访问 来 实现 不 可 变 。 以 
下 代码 中 的 类 定义 隐藏 了 所 有 名 称 以 下 划 线 〈_) 为 开头 的 属性 。 


class BlackJackCard3: 
"""Abstract Superclass""" 
































def init ( self, rank, suit, hard, soft ) : 
super(). setattr ( 'rank', rank ) 
super(). setattr ( 'suit', suit ) 
() . 


super _setattr ( 'hard', hard ) 
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super(). setattr ( 'soft', soft ) 
def setattr ( self, name, value ): 
if name in self. dict : 





raise AttributeError( "Cannot set {name}". 


format (name=name) ) 








raise AttributeError( "'{_ Cclass . name }' has no attribute 
'{name}'".format( _class = self. class , name= name ) ) 
def getattribute ( self, name ): 
if name.startswith(' '): raise AttributeError 
return object. getattribute ( self, name ) 





以 上 代码 重 写 了 _getattribute () 的 方法 逻辑 ， 当 访问 私有 名 称 或 Python 内 部 名 称 时 代码 会 
抛 出 异常 。 和 之 前 的 例子 相 比 , 这 样 做 的 其 中 一 个 好 处 是 : 对 象 被 封装 得 更 彻底 了 , 我 们 完全 无 法 改变 。 
以 下 代码 演示 了 和 这 个 类 的 交互 过 程 。 


>>> C = BlackJackCard3( 'A', '@', 1, 11 ) 
>>> c.rank= 12 



































Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 9, in setattr 
File "<stdin>", line 13, in getattribute 





AttributeError 

>>> C. dict ['rank']= 12 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 





File "<stdin>", line 13, in getattribute 





AttributeError 


般 情 况 下 ， 不 会 轻易 使 用 _getattribute ()。 该 函数 的 默认 实现 非常 复杂 ， 大 多 数 情 
况 下 ， 使 用 特性 或 改变 _getattr __() 函数 的 行为 就 足以 满足 需求 了 。 


3.5 创建 修饰 符 


侈 饰 符 可 看 作 属性 的 访问 中 介 。 人 1 
常 在 类 定义 时 被 创建 。 

侈 饰 符 模式 有 两 部 分 : 拥有 者 类 (owner class) 和 属性 修饰 符 (attripute descriptor)。 
拥有 者 类 使 用 一 个 或 多 个 修饰 符 作 为 它 的 属性 。 在 修饰 符 类 中 可 以 定义 获取 、 赋 值 和 删除 的 函数 。 



















































































多 饰 符 类 可 以 被 用 来 获取 、 赋 值 或 删除 属性 值 ， 修 饰 符 对 象 通 























































































































































































































一 个 修饰 符 类 的 实例 将 作为 拥有 者 类 的 属性 。 
特性 是 基于 拥有 者 类 的 函数 。 修 饰 符 不 同 于 特性 ， 与 拥有 者 类 之 间 没 有 耦合 。 因 此 ， 修 饰 符 通 常 可 
以 被 重用 ， 是 一 种 通用 的 属性 。 拥 有 者 类 可 同时 包含 同一 个 修饰 符 类 的 不 同 实例 ， 管 理 相似 行为 的 属性 。 






























































和 属性 不 同 ， 修 饰 符 是 在 类 级 别 定 义 的 。 它 的 引用 并 非 在 ”init __() 初始 化 函数 中 被 创建 。 修 
饰 符 可 在 初始 化 过 程 中 被 赋值 ， 修 饰 符 通常 作为 类 定义 的 一 部 分 ， 处 于 任何 函数 之 外 。 
当 定 义 拥 有 者 类 时 ， 每 个 修饰 符 对 象 都 是 修饰 符 类 的 实例 ， 绑 定 在 类 级 别 的 属性 上 。 
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3.5 创建 修饰 


为 了 标识 为 修饰 符 ， 修 饰 符 类 必须 实现 以 下 3 个 方法 的 一 个 或 多 个 。 
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@ Descriptor. get ( self, instance, owner ) 一 object: 在 这 个 方法 中 ， 
instance 参数 来 自 被 访问 对 象 的 self 变量 。 owner 变量 是 拥有 者 类 的 对 象 。 如果 这 个 
修饰 符 在 类 中 被 调用 ，instance 参数 默认 值 将 为 None。 此 方法 负责 返回 修饰 符 的 值 。 

@ Descriptor. set ( self, instance, value ): 在 这 个 方法 中 ，instance 
参数 是 被 访问 对 象 的 self 变量 ， 而 value 参数 为 即将 赋 的 新 值 

@ Descriptor. delete ( seLlf，instance ): 在 这 个 方法 中 ，instance 参数 是 
被 访问 对 象 的 self 变量 ， 并 在 这 个 方法 中 实现 属性 值 的 删除 。 

上 时， 修饰 符 类 也 需要 在 ”init () 函数 中 初始 化 修饰 符 内 部 的 一 些 状 态 。 

基于 方法 的 定义 ， 如 下 是 两 种 不 同 的 修饰 符 类 型 。 

@ 非 数 据 修饰 符 : 这 类 修饰 符 需要 定义 _set (或 _delete () 或 两 者 由 有 ， 但 不 能 定义 
_get () 。 非 数据 修饰 符 对 象 经 常用 于 构建 一 些 复杂 表达 式 的 逻辑 。 它 可 能 是 一 个 可 调用 对 象 ， 
可 能 包含 自己 的 属性 或 方法 。 一 个 不 可 变 的 非 数 据 修饰 符 必 须 实 现 _set _() 函数 ,而 逻辑 只 是 
单纯 地 抛 出 AttributeError 异常 。 这 类 修饰 符 的 设计 相对 简单 一 些 ， 因 为 接口 更 灵活 。 

@ 数据 修饰 符 : 这 类 修饰 符 至 少 要 定义 _get () 函数 。 通 常 ， 可 通过 定义 _get () 和 
__set () 函数 来 创建 一 个 可 变 对 象 。 这 类 修饰 符 不 能 定义 自己 内 部 的 属性 或 方法 ， 因 为 
它 通 常 是 不 可 见 的 。 对 修饰 符 属性 的 访问 ， 也 相应 地 转换 为 对 修饰 符 中 的 _get __()、 
_set () 或 delete () 方 法 的 调用 。 这 样 对 设计 是 一 个 挑战 ， 因 此 不 会 作为 首要 选择 。 
关于 修饰 符 的 使 用 有 大 量 的 例子 。 在 Python 中 使 用 修饰 符 的 场景 主要 有 如 下 几 点 。 

@ 类 内 部 的 方法 被 实现 为 修饰 符 。 它 们 是 非 数 据 修饰 符 ， 应 用 在 对 象 和 不 同 的 参数 值 上 。 

@ property() 函数 是 通过 为 命名 的 属性 创建 数据 修饰 符 来 实现 的 。 

@ 类 方法 或 静态 方法 被 实现 为 修饰 符 ， 修 饰 符 作 用 于 类 而 非 实 例 。 

在 第 11 章 “ 用 SQLite 保存 和 获取 对 象 ”中 ， 我 们 会 讲 到 对 象 关系 映射 ， 如 何 大 量 使 用 修饰 符 

的 ORM 类 ， 完 成 从 Python 类 定义 到 SQL 表 和 列 的 映射 。 














































































































































































































































































































当 设计 修饰 符 时 ， 通 过 考虑 以 下 3 种 常见 的 场景 。 

@ 修饰 符 对 象 包含 或 获取 数据 。 在 这 种 情况 下 ， 修 饰 符 对 象 的 self 变量 是 相关 的 并 且 修饰 
符 是 有 状态 的 。 使 用 数据 修饰 符 时 ， get __() 方法 用 于 返回 内 部 数据 。 使 用 非 数据 修饰 
符 时 ， 由 修饰 符 中 其 他 方法 或 属性 提供 数据 。 

@ ”拥有 者 类 实例 包含 数据 。 这 种 情况 下， 修饰 符 对 象 必须 使 用 instance 参数 获取 拥有 者 
对 象 中 的 数据 。 使 用 数据 修饰 符 时 ， get __() 函数 从 实例 中 获取 数据 。 使 用 非 数 据 修饰 
符 时 ， 由 修饰 符 中 其 他 方法 提供 数据 。 

@ ”拥有 者 类 包含 数据 。 在 这 种 情况 下 ， 修 饰 符 对 象 必须 使 用 owner 参数 。 由 修饰 符 实 现 的 
静态 方法 或 类 方法 的 作用 范围 通常 是 全 局 的 ， 这 种 做 法 是 常见 的 。 


我 们 会 详细 看 一 下 第 1 种 | 












































青 况 。 使 用 


get 


() 和 





set 





() 函数 创建 数据 修饰 符 ， 以 及 不 
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使 用 _get _() 方 法 的 情况 下 创建 非 数据 修饰 符 。 

第 2 种 情况 (数据 包含 在 拥有 者 实例 中 )， 正 是 @property 装饰 器 的 用 途 。 比 起 传统 的 特性 ， 
修饰 符 带 来 的 好 处 是 ， 它 把 计算 逻辑 从 拥有 者 类 搬 到 了 修饰 符 类 中 。 而 完全 采用 这 样 的 设计 思路 来 
设计 类 是 片面 的 ， 有 些 场景 不 能 获得 最 大 的 收益 。 如 果 计 算 逻 辑 相 当 复 杂 ， 使 用 策略 模式 则 更 好 。 


对 于 第 3 种 情况 ，@ staticmethod 和 eclassmethod 装饰 器 的 实现 就 是 很 好 的 例子 。 此 处 
不 再 装 述 。 


3.5.1 使 用 非 数 据 修饰 符 


经 常会 遇 到 一 些 对象 ， 内 部 的 属性 值 是 紧密 结合 的 。 
紧密 相关 的 数值 。 
以 下 代码 实现 了 一 个 简单 的 非 数据 修饰 符 类 的 实 3 
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了 举例 说 明 ， 在 这 里 看 一 些 和 测 











单位 


也 | 























污 
王 、 
瑟 
社 
加 


含 


get _() 函数 。 





class UnitValue 1: 
"""Measure and Unit combined.™"" 
def _ init ( self, unit ) : 
self.value= None 
self.unit= unit 
self.default format= "5.2f" 
def set ( self, instance, Value ) : 
self.value= value 
def str ( self ): 
return "{value:{spec}} {unit}".format( spec=self.default 
format, **self. dict ) 
def _ format ( self, spec="5.2f" ): 
#print ( "formatting", spec ) 
if spec == "": spec= self.default format 
return "{value:{spec}} {unit}".format( spec=spec, 
**Self。 dict ) 

















这 个 类 定义 了 简单 的 数值 对 ， 一 个 是 可 变 的 数值) 而 另 一 个 是 不 可 变 的 (单位 )。 
当 访 问 这 个 修饰 符 时 ， 修 饰 符 对 象 自身 先 要 可 用 ， 它 内 部 的 属性 或 方法 才 可 以 被 使 用 。 可 以 使 
用 这 个 修饰 符 来 创建 一 些 类 ， 这 些 类 用 于 计量 以 及 其 他 与 物理 单位 相关 数值 的 管理 。 
以 下 这 个 类 用 来 完成 速率 一 时 间 一 距离 的 计算 。 
class RTD 1: 
rate= UnitValue 1( "kt" ) 


time= UnitValue 1( "nr" ) 
distance= UnitValue 1( "nm" ) 
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def init ( self, rate=None, time=None, distance=None ) : 
if rate is None: 
self.time = time 
self.distance = distance 
self.rate = distance / time 
if time is None: 
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self.rate = rate 

self.distance = distance 

self.time = distance / rate 
if distance is None: 








self.rate = rate 
self.time = 七 im 
self.distance = rate * time 


def str ( self ): 
return "rate: {0.rate} time: {0.time} distance: 
{0.distance}".format (self) 


旦 对 象 被 创建 并 且 属 性 被 加 载 ， 默认 的 值 就 会 被 计算 出 来 。 一 旦 值 被 计算 ,修饰 符 就 可 以 被 
用 来 获取 数值 或 单位 名 称 。 另 外 ， 修 饰 符 还 包含 了 str () 函数 和 一 些 字符 串 格式 化 功能 的 函数 。 
以 下 是 一 个 修饰 符 和 RTD_1 类 交互 的 例子 。 


>>> ml = RTD 1( rate=5.8, distance=12 
>>> str (ml) 

'rate: 5.80 kt time: 2.07 hr distance: 12.00 nm' 
>>> print( "Time:" ml.time.value, ml.time.unit ) 
Time: 2.0689655172413794 hr 


我 们 使 用 rate 和 distance 参数 创建 了 RTD_1 的 实例 ， 它 们 用 于 完成 rate 和 distance 
修饰 符 中 set __() 函数 的 计算 逻辑 。 
当 调 用 str (m1) 函数 时 ,会 调用 RTD_1 中 全 局 的 _str __() 函数 ， 进 而 调用 了 速率 、 时 间 和 
距离 修饰 符 的 _format _() 函数 ， 并 会 返回 带 有 单位 的 数值 。 
于 非 数 据 修 饰 符 不 包含 _get _() 函数 ， 也 没有 返回 内 部 数值 ， 因 此 只 能 直接 访问 各 个 元 素 
值 来 获得 数据 。 


3.5.2 ”使 用 数据 修饰 符 

数据 修饰 符 使 得 设计 变 得 更 复杂 了 ， 因 为 它 的 接口 是 受 限 制 的 。 它 必须 包含 _get__() 方 法 ， 并 

只 能 包含 _set _() 方 法 和 _delete__() 方法 。 与 接口 相关 的 限制 可 以 包含 以 上 方法 的 1~3 个 ， 

不 能 包含 其 他 方法 。 引 入 额外 的 方法 将 意味 着 Python 不 能 把 这 个 类 正确 地 识别 为 一 个 数据 修饰 符 。 
接 下 来 将 实现 一 个 非常 简单 的 单位 转换 , 实现 过 程 由 修饰 符 中 _get _() 和 set _() 方法 来 完成。 
以 下 是 一 个 单位 修饰 符 的 基 类 定义 ， 实 现 了 标准 单位 之 间 的 转换 。 


class Unit: 




































































































































































































































































































































































































































































conversion= 1.0 

def _ get ( self, instance, owner ) : 
return instance.kph * self.conversion 

def set ( self, instance, value ) : 
instance.kph= value / self.conversion 


以 上 的 类 通过 简单 的 乘除 运算 实现 了 标准 单位 和 非 标准 单位 的 互 转 。 
使 用 这 个 基 类 , 可 以 定义 一 些 标准 单位 的 转换 。 在 之 前 的 例子 中 , 标准 单位 是 KPH ( 千 米 每 小 时 )。 
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以 下 是 两 个 转换 修饰 符 类 。 





class Knots( Unit ) : 


conversion= 0.5399568 


class MPH( Unit ): 
conversion= 0.621 


37119 











从 基 类 继承 的 方法 完成 了 此 过 程 的 实现 ， 唯 一 的 改变 是 转换 因数 。 这 些 类 可 用 于 包含 单位 转换 的 
数值 ， 可 以 用 在 MPH (英里 每 小 时 ) 或 海里 的 转换 。 以 下 是 一 个 标准 单位 的 修饰 符 定 义 千 米 每 小 时 。 






































class KPH( Unit ) : 
def get ( self, 








加. 



































instance owner ) : 


return instance. kph 





def set ( self, 


instance. kph= value 


instance, value ): 


























class Measurement: 


kph= KPH () 
knots= Knots () 
mph= MPH () 

















这 个 类 仅仅 是 定义 了 一 个 标准 ， 因 此 没有 任何 转换 逻辑 。 它 使 用 了 一 个 私有 变量 来 保存 KPH 中 的 
速度 值 。 遗 免 算术 转换 只 是 一 种 优化 技巧 ， 以 防止 任何 对 公有 
以 下 是 一 个 类 ， 包 含 了 给 定 测量 的 一 些 转换 过 程 。 











遇 性 的 引用 ， 这 是 避免 无 限 递归 的 前 提 。 
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def _ init ( self, kph=None, mph=None, knots=None ): 
if kph: self.kph= kph 
elif mph: self.mph= mph 
elif knots: self.knots= knots 


else: 





raise TypeError 


def str ( self 
return "Late: 
knots".format (self) 























) : 
{0.kph} kph = {0.mph} mph = {0.knots} 





对 于 不 同 的 单位 来 说 ， 每 一 个 类 级 别 的 属性 都 是 一 个 修饰 符 ， 在 get 和 set 函数 中 提供 转换 
过 程 的 实现 ， 可 以 使 用 这 个 类 来 转换 速度 之 间 的 各 种 单位 。 
以 下 是 使 用 这 个 Measurement 类 进行 交互 的 例子 。 
































>>> m2 = Measurement ( 
>>> str (m2) 



































knots=5.9 ) 


'rate: 10.92680006993152 kph = 6.789598762345432 mph = 5.9 knots' 


>>> m2 .kph 
10.92680006993152 
>>> m2 .mph 
6.789598762345432 


我 们 创建 了 Measurement 类 的 对 象 ， 设 置 了 不 同 的 修饰 符 。 例 子 中 ， 我 们 设置 了 knots (海里 ) 


修饰 符 。 
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当 数 值 需 要 显示 在 一 个 格式 化 的 字符 串 中 时 ， 修 饰 符 中 的 _get__() 方 法 就 会 被 调用 。 这 些 
函数 从 拥有 者 类 的 对 象 中 获取 KPH ( 千 米 每 小 时 ) 的 属性 值 ， 设 置 转换 因数 并 返回 结果 。 

KPH ( 千 米 每 小 时 ) 属性 也 使 用 了 一 个 修饰 符 。 这 个 修饰 符 没 有 做 任何 转换 。 然 而 ， 只 是 简单 
地 返回 了 拥有 者 类 对 象 中 缓存 的 一 个 私有 的 数值 。 当 使 用 KPH 和 Knots 修饰 符 时 ， 需 要 拥有 者 类 实 
现 一 个 KPH 属性 。 
3.6 总结、 设计 要 素 和 折 中 方案 

在 本 章 中 , 我 们 看 了 一 些 对 象 属性 的 工作 方式 。 我 们 可 以 使 用 object 类 中 已 经 定义 好 的 功能 
来 获取 和 设置 属性 值 ， 可 通过 定义 特性 来 改变 属性 的 行为 。 









































对 于 更 复杂 的 情 





况 ， 


Python 的 行为 。 
Python 在 内 部 使 
更 自然 ， 也 体现 了 一 种 
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可 以 习 





Fe 


了 修饰 符 实 现 一 
语言 的 优势 。 
其 他 语言 (尤其 Java 和 C++) 








EE 写 _getattr ()、 
getattribute _() 水 数 的 实现 。 这 样 一 来 ， 可 以 从 根本 上 更 细 粒 度 地 控制 (也 可 


些 函 数 、 静 态 方法 和 特性 。 








严 所 有 的 


_setattr () 和 gdelattr () 或 
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些 场景 ， 使 用 
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属性 定义 为 私有 的 ， 并 编写 可 
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的 程序 员 通 常 一 开始 要 
期 处 理 类 型 定义 





扩展 的 getter 和 setter 函数 。 对 了 














@ 此 处 应 当 有 很 好 


此 处 应 能 够 正确 地 反 



































在 Python 中 ， 建 议 把 所 有 的 属 怡 
的 文档 说 明 。 
映 出 对 象 的 状态 ， 它 们 不 应 当 是 暂 





























@ 在 少数 情形 下， 


内 ” 以 
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定义 范围 














私有 属性 是 令 人 厌烦 的 。 封 装 ， 并 不 会 














它 只 会 被 糟糕 的 设计 所 破坏 。 
3.6.1 特性 与 属性 对 比 
































此 表明 它 并 不 是 真正 意义 上 的 私有 。 
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的 语言 来 说 ， 这 种 


本 用 单 下 划 线 〈_) 来 标记 为 “不 在 接 








蝇 码 方式 是 可 取 的 。 














E 公 有， 这 意味 着 如 下 几 点 。 
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里 。 


时 性 的 或 者 临时 变 























大 | 





为 茶 种 编 











在 大 多 数 情 况 ， 


























就 可 以 有 效 地 工作 了 。 





有 时 对 一 个 属性 值 的 改变 会 造成 












































其 他 版 本 时 ， 只 需 简单 地 把 对 象 添 加 到 hand.cards : 
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属 性 








属性 附加 在 类 的 外 部 。 之 前 的 Hand 类 的 例子 


程 语言 缺乏 








种 复杂 的 私有 机 制 而 被 破坏 ， 


























演示 了 这 j 这 个 类 的 


























， 使 / 





j 延 到 证 





算 方 式 实 现 的 total 特性 ， 


























值 的 改变 ， 需 要 更 复杂 








的 类 定义 。 



































@ ”选择 在 函数 内 部 维护 状态 的 改变 ， 当 函数 定义 包含 多 个 参数 值 时 可 以 考虑 这 种 做 法 。 

@ 一 个 setter 特性 或 许 比 一 个 函数 要 表达 的 意图 更 清晰 。 当 只 需 访问 一 个 值 时 ， 这 个 做 法 
是 明智 的 。 

@ 我们 也 可 以 使 用 原 地 运算 符 ， 在 第 7 章 “ 创 建 数值 类 型 ”中 会 介绍 。 
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在 使 用 方面 没有 严格 的 规定 。 这 样 一 来 ， 当 需要 为 单一 参数 赋值 时 ， 在 方法 函数 与 属性 之 间 的 
区 别 在 API 语法 上 的 差异 以 及 在 传达 意图 上 是 否 有 更 好 的 方式 。 

对 于 已 经 计算 的 值 ， 特 性 允许 延迟 计算 ， 然 而 属性 却 需要 主动 计算 。 这 需要 在 性 能 上 进行 考虑 ， 
至 于 使 用 哪 一 种 还 要 看 具体 的 应 用 场景 。 


3.6.2 ”修饰 符 的 设计 
Python 中 定义 了 一 些 修饰 符 ， 我 们 并 不 需要 重新 创建 特性 、 类 方法 或 静态 方法 。 
创建 修饰 符 的 典型 例子 是 完成 Python 和 非 Python 之 间 的 映射 。 例 如 ， 对 于 对 象 关 系数 据 库 映 
射 ， 需 要 在 Python 类 中 定义 大 量 的 属性 ， 并 确保 它们 的 顺序 和 SQL 数据 表 中 列 的 顺序 是 一 致 的 。 
再 如 ， 当 需要 完成 Python 之 外 的 映射 时 ， 修 饰 符 类 可 以 用 来 完成 编码 和 解码 的 工作 ， 或 从 外 部 资 
源 中 获取 数据 。 
当 创 建 一 个 网 络 服务 客户 端 时 ， 可 以 考虑 使 用 修饰 符 来 完成 网 络 请 求 。 可 考虑 使 用 _get __() 
方法 构造 HTTP GET 请 求 对 象 ， 也 可 使 用 set _() 方 法 来 构造 HTTP PUT 请 求 对 象 。 
在 一 些 情形 下 ， 一 个 请 求 的 构造 可 能 需要 由 多 个 修饰 符 来 完成 。 这 样 的 话 ， 在 构造 一 个 新 的 
HTTP 请 求 对 象 之 前 ， get _() 函数 可 以 先 从 缓存 中 获取 可 用 的 实例 。 
许多 数据 修饰 符 的 操作 使 用 特性 会 更 容易 一 些 ， 可 以 这 样 的 思考 顺序 来 设计 : 先 考虑 特性 。 如 
果 特 性 的 逻辑 非常 复杂 ， 可 以 考虑 使 用 修饰 符 或 对 类 进行 重 构 。 


3.6.3 ”展望 

在 下 一 章 中 ， 会 着 重 介 绍 抽 象 基 类 (Abstract Base Classes，ABC)， 在 第 5 章 、 第 6 章 和 第 7 
章 也 会 深入 探讨 。 这 些 抽象 基 类 会 帮助 我 们 定义 一 些 可 以 和 Python 机 制 无 颖 集成 的 类 ， 这 也 使 得 
类 层次 结构 的 设计 能 够 在 一 致 性 设计 和 扩展 性 上 发 挥 更 大 的 作用 。 
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Python 标准 库 为 若干 容器 类 的 特性 提供 了 抽象 基 类 。Python 为 内 置 的 容器 类 (例如 1ist、map 
和 set ) 提供 了 一 致 的 框架 。 

另外 , 标准 库 也 为 数值 类 型 提供 了 抽象 基 类 。 我 们 可 以 使 用 这 些 类 来 扩展 Python 支持 的 数值 类 型 。 

我 们 会 通过 collections .abc 模块 来 了 解 抽象 基 类 的 基本 概念 。 从 这 里 开始 ， 我 们 会 关注 
抽象 基 类 的 一 些 用 例 ， 它 们 也 是 以 后 一 些 章节 的 主题 。 
我 们 有 3 个 设计 原则 : 封装 、 扩 展 和 创建 。 除 了 了 解 各 种 容器 和 集合 类 型 以 外 ， 我 们 可 能 还 要 了 
解 封 装 或 者 扩展 的 一 般 概念 。 类 似 地 ， 我 们 也 会 关注 除了 数值 类 型 外 一 些 其 他 想 要 实现 的 一 般 概念 。 
我 们 的 目标 是 保证 我 们 的 程序 能 够 和 了 Python 内 置 的 特性 无 颖 集成 。 例 如 ， 我 们 创建 一 个 集合 ， 最 好 
能 够 让 集合 也 实现 一 个 _iter__() 友 代 器 。 一 个 实现 了 _iter__() 的 集合 可 以 与 for 语句 很 好 地 集成 。 


4.1 抽象 基 类 


抽象 基 类 的 核心 定义 在 一 个 名 为 abc 的 模块 中 。 模 块 中 包括 了 创建 抽象 基 类 需要 的 修饰 符 和 元 
类 型 。 其 他 的 类 也 依赖 于 这 些 定义 。 
在 Python 3.2 版 本 中 , 集合 的 抽象 基 类 定义 在 collections 中 。 但 是 , 在 Python 3.3 版 本 中 ， 
抽象 基 类 被 分 离 到 了 一 个 独立 的 模块 collections .abc 中 。 
我 们 还 会 介绍 numbers 模块 ， 因 为 它 包含 了 数值 类 型 的 抽象 基 类 的 定义 。io 模块 包含 了 IO 
的 抽象 基 类 。 
我 们 主要 基于 Python 3.3 版 本 讨论 。Python 3.3 版 本 中 的 定义 对 Python 3.2 版 本 也 同样 适用 ， 
只 是 由 于 库 的 结构 有 一 些 变化 ， 需 要 稍微 修改 一 下 import 语句 。 
一 个 抽象 基 类 具有 以 下 特性 。 
@ 抽象 意味 着 这 些 类 中 不 包括 我 们 需要 的 所 有 方法 的 定义 。 为 了 让 它 成 为 一 个 真正 有 用 的 子 
类 ， 我 们 需要 提供 一 些 方法 定义 。 
@ 基 类 意味 着 其 他 类 会 把 它 当 作 基 类 来 使 用 。 


@ 抽象 类 本 身 提 供 了 一 些 方法 的 定义 。 更 习 
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1 象 基 类 为 缺失 的 方法 函数 提供 了 方法 
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签名 。 子 类 必须 提供 












































































































































































































































正确 的 方法 来 创建 符合 抽象 类 定义 的 接口 的 具体 类 。 

这 些 抽象 类 的 特性 是 基于 下 面 的 初衷 设计 的 。 

@ 我 们 可 以 用 它们 为 Python 的 内 部 类 和 我 们 的 程序 中 的 自 定义 类 定义 一 组 一 致 的 基 类 。 

@ 我们 可 以 用 它们 创建 一 些 通用 的 、 可 重用 的 抽象 。 

@ 我们 可 以 用 它们 来 支持 适当 的 类 检查 ， 以 确定 一 个 类 的 功能 。 这 让 我 们 的 自 定 义 类 可 以 与 
库 中 的 类 更 好 地 协作 。 为 了 正确 地 实现 类 检查 ， 对 于 像 “ 容 器 ”和 “数值 ”这 种 概念 ， 我 
们 最 好 可 以 有 正式 的 定义 。 

如 果 没 有 抽象 基 类 ， 一 个 容器 不 一 定 能 够 为 Sequence 类 提供 一 致 的 特性 。 这 经 常会 导致 我 们 








4 日 
集 














我 们 在 以 下 这 些 情 况 下 会 考虑 
@ 当 我 们 自 定义 类 时 ， 使 | 
@ 我们 在 一 个 方法 中 使 


对 于 多 
class SomeApplicationClass( 


SomeApplicationClasss 定义 为 一 个 callable 类 。 接着 , 它 必 须 实现 可 
方法 ， 和 否则 我 们 无 法 使 ) 
一 个 函数 是 一 个 callable 类 的 
部 分 和 第 








对 


some method() 方法 要 求 other 参数 是 Iterator 的 
这 个 测试 ， 我 们 会 得 





到 一 个 很 像 Sequence 的 类 。 反 过 来 , 这 也 会 
Sequence 提供 完整 实现 的 类 ， 


使 用 提 





























象 基 类 ， 你 就 可 以 保证 一 个 给 定 的 类 会 有 所 有 我 们 预 
的 一 个 特性 ， 那 么 这 个 未 定义 的 提 


yy nn 
中 
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已 





这 会 给 出 一 些 笨拙 的 解 祖 











办 法 。 


奇怪 的 不 一 致 的 行为 ， 而 对 于 一 个 没有 为 



























































AS 


象 方法 会 造成 无 法 使 

















使 用 抽象 基 类 。 














类 














| 抽象 基 类 作为 基 
| 抽象 基 类 来 确 


ed 


保 一 种 操作 是 可 行 的 。 


















































我 们 在 诊断 信息 或 者 























pass 

















章 “ 可 调 























self, 


j 它 来 创建 实例 。 


用 对 象 和 上 下 文 的 使 用 ” 
于 第 2 种 情况 ， 我 们 可 


defsome _method( 











异常 中 使 ) 

















Lections .abc 


collections.abc.Callable ) : 





























< 











体例 子 。 提 





象 























能 会 用 下 面 的 方式 定义 方法 。 


Other ) : 


assertisinstance (other, collections.abc.Iterator) 































































































面 的 部 分 中 ， 我 们 会 看 到 这 种 用 法 。 
对 于 第 3 种 情况 ， 可 以 使 用 以 下 代码 进行 判断 。 
七 TY : 


some obj.some method( another ) 
exceptAttributeError: 

















期 的 行为 。 如 果 这 个 类 没有 
j 这 个 类 构建 对 象 实例 。 


j 抽 象 基 类 来 指出 一 种 操作 为 什么 不 能 
FF 第 1 种 情况 ， 我 们 可 能 会 用 下 面 的 方式 创建 模块 。 


import coll 























生效 。 





回 








调 对 象 需要 的 





类 是 定义 了 _call () 方 法 的 类 。 在 后 
， 我 们 会 介绍 callable 类 的 细节 。 


看 的 

















个 子 类 。 如 果 other 参数 无 法 通过 
到 一 个 异常 。 另 外 一 种 更 好 的 方法 是 在 if 语句 中 抛 出 一 个 




















TypeError。 在 下 
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warnings .warn( "{0!r} not an Iterator, found {0. class . bases !r}". 





format (another) ) 
raise 


在 这 个 例子 中 ， 我 们 输出 了 包含 给 定 对 象 基 类 的 警告 信息 ， 这 些 信息 有 助 于 我 们 调试 。 
4.2 基 类 和 多 态 


在 这 个 部 分 中 ， 我 们 来 看 看 特别 糟糕 的 多 态 实 现 。 在 Python 编程 实践 中 ， 有 一 些 特 殊 的 情 
参数 值 的 检查 应 该 被 独立 看 待 。 

设计 很 好 的 多 态 通 常会 符合 Liskov 蔡 换 原 则 。 基 于 这 个 原则 ， 多 态 类 之 间 可 以 互相 替换 而 
昌 每 一 个 多 态 类 都 包含 相同 的 属性 。 如 果 想 查看 更 多 这 方面 的 信息 ， 请 参见 http://en.wikipedia. 
org/wiki/Liskov_substitution_principle。 

过 度 使 用 isinstance () 来 区 分 参数 的 类 型 在 带 来 不 必要 的 复杂 性 的 同时 会 降低 程序 的 效 
率 。 程 序 中 持续 在 进行 实例 的 比较 ， 但 是 通常 只 有 在 软件 维护 阶段 才 会 发 现 错误 。 比 起 在 代码 中 使 
用 元 长 的 类 型 检查 ， 单 元 测试 能 够 更 有 效 地 发 现代 码 中 的 错误 。 
包含 许多 isinstance () 方法 的 函数 可 以 被 认为 是 糟糕 的 多 态 实现 的 标志 。 相 比 于 在 类 的 外 部 
处 理 类 型 相关 的 操作 ， 通 常 更 好 的 方式 是 扩展 或 者 封装 ， 让 它们 更 合理 地 实现 多 态 性 并 且 将 类 型 相 
关 的 处 理 封装 起 来 。 

isinstance() 方 法 的 一 个 很 好 的 用 处 是 用 来 创建 诊断 信息 ， 使 用 在 assert 语句 中 是 其 
一 种 简单 的 用 法 。 
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assertisinstance( some argument, collections.abc.Container ), 


"{0!r} not a Container".format (some argument) 


当 有 问题 发 生 时 ， 这 段 代 码 会 抛 出 一 个 AssertionError 异常 。 这 样 做 的 优点 是 用 很 短 的 代 
码 就 达到 了 我 们 的 目的 。 但 是 ， 这 样 的 用 法 有 两 个 缺点 : assert 语句 有 可 能 不 会 抛 出 异常 ， 所 以 
显 式 地 抛 出 一 个 TypeError 异常 可 能 会 更 好 一 些 。 下 面 是 一 个 更 好 的 例子 。 







































































if not isinstance (Some argument，collections .abc.Containezr) : 





raiseTypeError( "{0!r} not a Container" .format (Some argument ) 


) 


上 面 的 代码 的 优点 是 它 显 式 地 抛 出 了 正确 的 异常 ， 缺 点 就 是 代码 太 长 了 。 
更 具有 Python 风格 的 做 法 总 结 如 下 : 

“请 求 原谅 比 请 求 许可 更 好 。” 

这 句 的 意思 是 我 们 应 该 尽量 减少 直接 测试 参数 (请 求 许可 ) 来 确定 它们 的 类 型 是 否 正确 。 参 数 
类 型 检查 没有 任何 实际 的 好 处 。 取 而 代 之 的 是 ， 我 们 应 该 合理 地 处 理 异常 (请 求 原谅 )。 

如 果 使 用 了 不 正确 的 类 型 却 仍然 通过 了 单元 测试 这 种 情况 不 太 可 能 发 生 , 最 好 的 方式 是 结合 使 
用 诊断 信息 和 异常 。 
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下 面 是 我 们 经 常会 使 用 的 策略 。 


七 TY : 
found = value in some argument 
exceptTypeError: 
if not isinstance(some argument, collections.abc.Container): 
warnings.warn( "{0!r} not a Container".format (some argument) ) 
raise 








isinstance () 方 法 假定 some_argument 是 一 个 正确 的 collections.abc. Container 
实例 ， 并 将 结果 返回 给 in 运算 符 。 

在 一 些 特殊 情况 ne 将 一 个 错误 的 类 作为 some_argument 参数 ， 
我 们 的 程序 会 输出 一 条 诊断 信 息 ， 然 后 以 抛 出 一 个 TypeError 异常 的 方式 将 程序 终止 。 


4.3 可 调用 对 象 


Python 中 可 调用 对 象 的 定义 包括 显 式 地 使 用 def 语句 创建 函数 。 
它 同时 也 包括 了 任何 定义 了 _cal1 _() 方 法 的 类 。 在 Python 3 Object Oriented Programming 
， 我 们 可 以 看 到 一 些 这 样 的 例子 。 i 我 们 应 该 让 所 有 
的 可 调用 对 象 继承 自 collections.abc.Callable。 
对 于 Python 中 的 任何 函数 ， 我 们 都 可 以 看 到 下 面 的 操作 。 


>>>abs (3) 

3 

>>>isinstance(abs, collections.abc.Callable) 
True 










































































































































































内 置 的 abs () 函数 是 一 个 collections .abc.callable 的 实现 。 对 于 我 们 自 定义 的 函数 ， 
这 条 规则 也 适用 ， 请 看 下 面 的 例子 。 


>>>def test (mn) : 


return n*n 




















>>>isinstance (test, collections.abc.Callable) 
True 

















所 有 的 函数 都 认为 自己 属于 callable 类 。 这 样 做 有 助 于 简化 参数 的 类 型 检查 ， 同 时 也 能 够 
记录 更 有 意义 的 调试 信息 。 
在 第 5 章 “ 可 调用 对 象 和 上 下 文 的 使 用 ”中 ， 我 们 会 详细 介绍 可 调用 对 象 的 细节 。 










































































4.4 ”容器 和 集合 











除了 内 置 的 容器 类 之 外 ，collections 模块 也 定义 许多 集合 。 这 些 容器 类 包括 namedtuple ()、 
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deque、ChainMap、Counter、OrgderedDict 和 defaultdqict。 所 有 这 些 类 都 是 基于 抽象 基 
类 定义 类 的 例子 。 
下 面 是 在 命令 行 中 显 式 集合 是 否 文 持 一 个 特定 方法 的 快捷 方式 。 
>>>isinstance( {}, collections.abc.Mapping ) 
PO er collections.abc.Mapping) 
我 们 可 以 检查 简单 的 dict 类 ， 看 它 是 否 遵 循 基本 的 映射 协议 ， 并 支持 必需 的 方法 。 
我 们 可 以 检查 defaultqdict 和 集合， 确认 它 也 是 一 种 映射 。 
当 自 定义 容器 的 时 候 ， 可 以 不 用 这 样 正式 的 方法 。 我 们 可 以 创建 一 个 包含 所 有 正确 的 特殊 方法 
的 类 。 但 是 ， 不 用 正式 声明 这 个 类 为 某 种 容器 。 
使 用 正确 的 抽象 基 类 作为 我 们 程序 中 自 定 义 类 的 基 类 显得 更 清晰 也 更 可 靠 , 额外 的 形式 化 声明 
有 以 下 两 个 优点 。 
@ ”对 于 读 (和 有 可 能 在 使 用 或 者 维护 ) 我 们 代码 的 人 ， 这 样 的 声明 清晰 地 表达 了 我 们 设计 这 
个 类 的 意图 。 当 我 们 继承 自 collections.abc.Mapping 时 ， 我 们 就 已 经 很 清晰 地 表 
达 了 这 个 类 应 该 被 如 何 使 用 。 
@ 这样 的 声明 能 够 对 错误 诊断 提供 一 些 文 持 。 如 果 没 有 正确 地 实现 所 有 必需 的 方法 , 那么 就 会 
无 法 创建 这 个 抽象 基 类 的 实例 。 如 果 因 为 无 法 创建 对 象 的 实例 而 使 单元 测试 失败 ， 就 说 明 


内 置 容器 的 完整 图 谱 都 是 用 
Sized。 而 它们 同时 也 是 高 级 构造 过 程 的 





iter 





这 是 一 个 必须 修复 的 大 问题 。 























() 和 len ()。 





高 级 的 特性 包括 以 下 几 个 部 分 。 


Sequence 和 MutableSequence: 它们 是 1ist 和 tuple 的 抽象 基 类 ， 具 


现 还 包括 bytes 和 str。 


MutableMapping: 这 是 dict 的 
的 实现 。 





Set 和 MutableSet: 它们 是 frozenset 和 set 的 





1 象 基 类 来 表示 的 。 底 层 的 特 愧 


























1 象 基 类 ， 它 扩展 了 Mapping 类 , 但 是 没有 内 置 




















| 象 基 类 ，。 














这 些 特性 允许 我 们 创建 新 的 类 ， 扩 展现 


晰 、 流 





畅 。 
在 第 6 章 “ 创 建 容器 和 集合 ”中 ， 我 们 会 衣 

















4.5 ”数值 类 型 


kK 





我 们 需要 创建 新 的 数值 类 3 






































岂 或 者 扩展 现 有 的 数值 类 











F 细 探讨 容器 和 集 






































本 的 序列 


FE 包括 Container、Iterable 和 
部 分 。 它 们 需要 一 些 特殊 方法 ， 分 别 是 _contains _()、 





















































的 类 并 且 能 够 使 之 与 Python 内 置 特性 的 集成 


























蜡 时 ， 需 要 用 到 numbers 模块 。 这 个 模 
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块 包含 y Python 内 置 数值 类 型 的 抽象 定义 。 从 最 简单 的 数值 类 型 到 最 











成 一 个 庞大 的 层次 结构 。 在 这 个 例子 ! 
numbers .Number 抽象 基 类 定义 了 所 有 数 





>>> import numbers 







































































>>>isinstance( 42, numbers.Number ) 


True 
>>> 355/113 


3.1415929203539825 
>>>isinstance( 355/113, numbers.Number ) 


TEUS 





很 明显 ， 整 数 和 浮 点 数 都 是 numbers .Number 抽象 基 类 的 子 类 。 
这 个 基 类 的 子 类 包括 numbers.Complex、 numbers.Real、 
numbers .Integral。 这 些 定义 和 数学 上 对 不 同 数 字 的 分 类 是 一 致 的 。 





但 是 ，decimal.Decimal 类 和 这 些 类 不 太一 样 。 我 们 可 以 用 下 





来 看 看 它 和 其 他 类 的 关系 。 





>>>issubclass (decimal 


True 


>>>issubclass (decimal 


False 


>>>issubclass (decimal 


False 


>>>issubclass (decimal 


False 





>>>issubclass (decimal 





False 





对 于 Decimal 与 所 有 内 置 的 具 




















.Decimal 


.Decimal 


.Decimal 


.Decimal 


.Decimal 























;: numbers.Number ) 


: numbers.Integral ) 


: numbers.Real ) 


: numbers.Complex ) 


: numbers.Rational ) 





体 数 值 类 型 都 没有 关系 这 一 点 ， 











复杂 的 ， 这 些 类 型 共 


构 


可 


， 简 单 和 复杂 指 的 是 可 用 方法 的 集合 。 
值 以 及 类 数值 类 型 ， 我 们 使 用 下 面 的 代码 来 介绍 这 个 类 。 

















numbers .Rational 和 


而 代码 中 的 issupclass () 


并 不 用 感到 奇怪 。 对 于 











numbers .Rational 的 具体 实现 ， 请 参见 fractions 模块 。 在 第 7 章 “ 创 建 数值 类 型 ”中 ， 我 
们 会 详细 介绍 这 些 不 同 的 数值 类 型 。 


4.6 其 他 的 一 些 抽 象 基 类 


接 下 来 ,我 们 会 介绍 其 他 的 一 些 有 趣 的 抽象 基 类 ， 它 们 很 少 被 扩展 。 但 这 并 不 意味 着 这 些 类 很 

















少 被 使 用 ， 只 是 这 些 抽象 基 类 的 














































































































管理 器 带 来 的 不 同 的 实现 方式 。 这 和 其 
下 文 的 使 用 ”中 ， 我 们 会 详 引 






























































体 实现 很 少 需要 扩展 和 修改 。 
我 们 也 会 介绍 collections.abc.Iterator 中 定义 的 迭代 器 。 同 时 ， 我们 还 会 介绍 上 下 文 






































他 的 抽象 基 类 的 定义 不 尽 相 同 。 许 




















4.6.1 近代 器 的 抽象 基 类 


| 


探讨 这 个 内 容 。 








我 们 在 for 语句 ! 








使 
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E 第 5 蔓 “ 可 调用 对 象 和 上 


j 一 个 可 迭代 的 容器 时 ，Python 会 隐 式 地 创建 一 个 迭代 器 。 所 以 我 们 几乎 不 
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用 关心 迭代 器 本 身 。 即 使 有 时 候 我 们 真 的 需要 关心 迭代 器 的 细节 ， 也 很 少 需 要 扩展 或 者 修改 现 有 的 实现 。 
我 们 可 以 通过 iter () 函数 来 剖析 Python 使 用 的 隐 式 迭代 器 ， 可 以 用 下 面 的 方式 和 迭代 器 进行 交互 。 




































































>>> x = 1 277 |] 
>>>iter (x) 
<list iterator object at 0x1006e3c50> 


>>>x iter = iter (x) 
>>>next (x_ iter) 
>>>next (x _ iter) 

2 

>>>next (X_ iter) 

3 

>>>next (x _ iter) 








Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
StopIteration 
>>>isinstance (x iter, collections.abc.Iterator ) 
True 


我 们 创建 一 个 基于 列表 对 象 的 迭代 器 ， 然 后 调用 next () 函数 来 遍历 列表 中 的 值 。 

































































最 后 的 isinstance () 
实例 。 
































达 式 确定 了 这 个 迭代 器 对 象 是 collections.abc.Iterator 的 一 个 


大 多 数 时 候 ， 我们 会 使 用 集合 类 自己 创建 的 迭代 器 。 但 是 ， 当 我 们 想 创建 自己 的 集合 类 型 或 者 
扩展 一 个 集合 类 时 ， 就 可 能 需要 创建 一 个 不 一 样 的 迭代 器 。 在 第 6 章 “ 创 建 容器 和 集合 ”中 ， 我 们 


















































会 详细 探讨 这 个 内 容 。 


4.6.2 上 下 文科 上 下 文 管理 右 


























一 个 上 下 文 管理 是 和 with 语句 一 起 使 用 的 。 当 我 们 写 了 如 下 的 代码 时 ， 就 说 明 我 们 正在 使 用 



































上 下 文 管理 器 。 


with function(arg) as context: 


process( context ) 



































在 上 面 的 例子 中 ，function (arg) 创 建 了 上 下 文 管理 器 。 


























一 个 常用 的 上 下 文 管理 器 是 一 个 文件 。 当 打开 文件 时 ， 我 们 应 该 创建 一 个 会 自动 关闭 文件 的 上 
































下 文 管理 器 。 所 以 ， 我 们 几乎 应 该 总 是 以 下 面 的 方式 操作 文件 。 


with open("some file") as the file: 























process (the _ file ) 








在 with 语句 中 的 代码 执行 完成 后 ，Python 可 以 保证 文件 一 定 会 正确 地 关闭 。Context1Lib 

























































































模块 提供 了 一 些 用 于 创建 上 下 文 管理 器 的 工具 。 这 个 库 没有 提供 任何 抽象 基 类 ， 而 是 提供 了 装饰 
器 和 contextlib.ContextDecorator 基 类 ， 其 中 装饰 器 会 将 简单 的 函数 转 成 上 下 文 管理 器 ， 
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contextlib.ContextDecorator 基 类 可 以 被 扩展 并 创建 一 个 上 下 文 管理 器 类 。 
在 第 5 章 “ 可 调用 对 象 和 上 下 文 的 使 用 ”中 ， 我 们 会 详细 讲解 上 下 文 
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4. 7 abc 模块 
































创建 抽象 基 类 的 核心 方法 定义 在 abc 模块 中 。 此 模块 中 包含 的 ABCMeta 类 提供 了 一 些 有 用 的 特性 。 
首先 ，ABCMeta 类 保证 抽象 基 类 不 可 以 被 实例 化 。 但 是 ， 一 个 提供 了 所 有 必须 实现 的 子 类 可 以 被 
实例 化 。 这 个 元 类 型 会 在 执行 _new () 的 时 候 调 用 抽象 基 类 中 的 _subclasshook _() 特殊 方法 。 










































































如 果 这 个 方法 返回 Not Implemented， 就 会 抛 出 一 个 异常 ， 指 出 当前 类 没有 实现 所 有 必需 的 方法 。 
其 次 ， 它 提供 了 instancecheck () 和 subclasscheck () 的 定义 。 这 两 个 特殊 方 
法 实现 了 isinstance() 和 issubclass() 两 个 内 置 的 函数 。 它 们 用 于 确保 一 个 对 象 〈 或 者 类 ) 
属于 正确 的 抽象 基 类 。 同 时 ， 为 了 提高 性 能 ， 这 个 类 也 会 包括 一 个 子 类 的 缓存 。 

abc 模块 还 包括 了 许多 用 于 创建 抽象 方法 函数 的 装饰 器 , 子 类 中 必须 实现 用 这 些 装饰 器 定义 的 
抽象 方法 。 其 中 最 重要 的 是 aabstractmethod 装饰 器 。 
在 我 们 试图 创建 一 个 新 的 抽象 基 类 时 ， 我 们 会 像 下面 这 样 做 。 


from abc import ABCMeta, abstractmethod 

class AbstractBettingStrategy (metaclass=ABCMeta): 
_slots = () 
Qabstractmethod 
def bet (self, hand): 


return 1 























































































































































































































Qabstractmethod 
def record win(self, hand): 
pass 








Qabstractmethod 
def record loss(self, hand): 
pass 





@classmethod 
def subclasshook (cls, subclass): 
if cls is Hand: 
if (any ("bet" in B. dict for B in subclass. mro ) 
and any ("record win" in B. dict for B in 
subclass. mro ) 


and any ("record loss" in B. dict for B in 
subclass. mro ) 
} 
return True 
return NotImplemented 


这 个 类 用 ABCMeta 类 作为 它 的 元 类 型 ; 同时 , 它 也 实现 了 用 于 检查 类 型 完整 性 的 _supclasshook _() 
方法 。 这 些 方法 提供 了 作为 一 个 抽象 基 类 应 有 的 核心 特性 。 
这 个 抽象 基 类 使 用 abstractmethod 装饰 器 定义 了 3 个 抽象 方法 , 任何 试图 实现 这 个 抽象 类 
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的 子 类 都 必须 实现 这 3 个 方法 。 

subclasshook 方法 需要 这 3 个 方法 都 被 实现 。 这 样 的 做 法 似乎 有 一 些 过 于 严格 了 ， 
为 一 个 很 简单 的 下 注 方法 不 应 该 提供 用 来 计算 输赢 的 方法 。 

subclasshook 依赖 于 Python 内 置 的 两 个 类 特性 : _ qict _ 特性 和 mro_ 特性 。 
_ dict 特性 用 于 存储 类 中 定义 的 方法 名 和 特性 名 ,这 个 特性 中 存储 了 类 的 主体 。 _mro_ 特性 
记录 了 解析 方法 的 顺序 ， 这 个 特性 记录 了 当前 类 层次 结构 的 顺序 。 由 于 Python 中 人 允许 多 继承 ， 
此 有 可 能 有 许多 基 类 ， 那 么 这 些 基 类 的 顺序 同时 也 决定 了 解析 方法 名 的 优先 级 。 

下 面 是 一 个 实现 这 个 基 类 的 例子 。 
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class Simple Broken (AbstractBettingStrategy): 
def bet( self, hand ) : 
return 1 


上 面 的 类 无 法 使 用 ， 因 为 它 没有 为 3 个 抽象 方法 提供 实现 。 
下 面 是 当 我 们 试图 创建 这 个 子 类 的 实例 时 会 发 生 的 情况 。 


>>>simple= Simple Broken () 






































Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
ypeError: Can't instantiate abstract class Simple Broken with 








abstract methods record loss, record win 
错误 信息 指出 这 个 具体 类 是 不 完整 的 ， 下 面 是 一 个 可 以 通过 完整 性 测试 的 类 。 


class Simple (AbstractBettingStrategy): 
def bet( self, hand ) : 
return 1 


























def record win(self, hand): 
pass 

def record loss(self, hand): 
pass 


我 们 可 以 创建 这 个 类 的 一 个 实例 并 将 它 用 于 程序 的 模块 中 。 
如 上 所 述 ，bet () 方法 应 该 是 唯一 必须 被 实现 的 方法 。 另 外 两 个 方法 中 可 以 允许 使 用 单独 的 
pass 语句 作为 默认 实现 。 


4.8 总结、 设计 要 素 和 折 中 方案 


在 本 章 中 ， 我 们 介绍 了 抽象 基 类 中 最 重要 的 部 分 。 对 于 每 种 抽象 基 类 ， 我 们 都 介绍 了 它们 的 一 

些 特性 。 
我 们 也 学 习 到 一 个 好 的 类 设计 中 应 该 尽 可 能 地 使 用 继承 。 我 们 使 用 了 两 大 不 同 的 模式 ， 也 看 了 

这 条 原则 的 一 些 特殊 情况 。 
些 程序 中 的 类 需求 的 行为 无 法 重用 Python 内 置 的 特性 。 在 我 们 21 点 的 例子 中 ， 一 张 牌 不 是 
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一 个 数值 类 型 、 一 个 容器 、 一 个 迭代 器 或 者 一 个 上 下 》 























会 自 定义 一 个 新 类 ， 














为 没有 任何 内 置 的 特 改 
但 是 ， 当 我 们 看 Hand 类 让 





















































。 在 这 个 例子 中 ， 通 常 我 们 








门 在 第 1 章 “ init 0 方 


法 ”和 第 2 章 “ 与 Python 无 颖 集成 一 一 基本 特殊 方法 ”中 所 叙述 的 ， 下 面 是 3 个 基本 的 设计 原则 。 





@ 封装 一 个 现 有 的 容器 。 
@ 扩展 一 个 现 有 的 容器 。 














@ 创建 一 个 全 新 的 容器 。 
大 多 数 情况 下 ,我 










































































万 法 。 























们 会 选择 封装 或 者 扩展 一 个 现 
当 我 们 扩展 一 个 现 有 的 类 时 ， 我 们 的 自 定义 
一 个 扩展 了 内 置 的 1ist 类 就 已 经 是 collections.abc.MutableSequence 的 一 个 实例 



































的 容器 ， 这 和 我 们 尽 可 能 使 用 继承 的 原则 一 致 。 
够 很 好 地 融入 这 个 现 有 类 的 层次 结构 中 。 例 如 ， 




















但 是 ， 当 我 们 封装 


保留 ， 有 哪些 部 分 我 们 不 想 保留 。 在 

















| 
个 现 有 的 类 时 ， 我 们 必须 仔细 地 考虑 原始 接口 中 有 哪些 部 分 我 们 想 
j 装 的 1ist 对 象 , 我 们 只 提 到 












































变 序列 的 实现 ， 所 以 有 很 多 特性 它 无 法 支持 。 另 一 方面 ， 











1 于 封装 好 的 新 类 不 是 一 个 完整 的 不 可 








一 个 扩展 类 在 很 多 情况 
~ 展 一 个 类 不 足以 满足 我 
于 新 创建 的 一 个 集合 类 型 必须 提供 








如 果 我 们 发 现 


























EA 
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上]， 一 个 扩展 了 1ist 日 
门 的 需求 ,我 们 可 以 考虑 创建 












































的 Hand 类 天 生 就 是 可 和 迭代 的 。 


个 全 新 的 集合 类 型 。 至 




















Ph 些 方法 才能 与 现 有 的 Python 特 牧 





























展望 


























FE 无 颖 集成 ， 抽 象 基 类 的 定义 















































在 后 面 的 章节 ! 




















下 文 的 使 用 ”中 ， 我 人 
合 ” 中 ， 我 们 会 介绍 Python 中 内 置 的 容器 和 集合 ， 同 时 也 




























































































在 第 7 章 “ 创 建 数值 类 型 ”: 





们 会 介绍 不 同 的 数值 类 型 ， 























中 提供 了 许多 建议 。 在 第 6 章 “ 创 建 容器 与 集合 ”中 ， 我 们 会 给 出 一 个 创建 集合 类 型 的 详细 例子 。 


] 本章 中 讨论 的 这 些 抽象 基 类 。 在 第 5 章 “ 可 调用 对 象 和 上 
FE。 在 第 6 章 “ 创 建 容器 和 外 
绍 如 何 创 建 一 种 独特 的 新 容器 。 最 后 ， 
并 且 会 介绍 如 何 自 定义 数值 类 型 。 











tm 


























的 性 能 ， 记 


制 上 下 文中 
就 会 被 适当 


第 5 章 


可 调用 对 象 和 上 下 文 的 使 用 














我 们 可 以 使 用 collections.abc.Callable 抽象 基 类 和 记忆 化 技术 来 创建 类 似 函 数 的 对 象 ， 











乙 功能 是 基本 的 。 
上 下 文 使 得 资源 的 管理 更 优雅 可 靠 。with 语句 定义 了 上 下 文 并 
的 资源 使 用 。Python 的 文件 通常 都 包含 了 上 下 文 管理 器 ; 
地 关闭 。 我 们 会 看 到 一 些 使 用 context1l1ib 模块 中 的 工 
在 Python 3.2 中 ， 抽 象 基 类 定义 在 collections 模块 中 。 
在 Python 3.3 中 ， 抽 象 基 类 定义 在 有 一 个 单独 的 、 命 名 为 collections.abd 的 子 模块 中 。 在 
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但 它们 的 运行 速度 会 快 一 些 ， 因 为 它们 可 以 记忆 上 一 次 的 处 理 结果 。 在 一 些 情 














下 ， 为 了 优化 算法 

















创建 了 一 个 上 下 文 管理 器 来 控 
每 当 使 用 with 语句 时 ， 它 们 
来 创建 上 下 文 管理 器 的 方式 。 





















































本 章 中 , 我 们 会 专注 Python 3.3 版 本 。 基本 定义 和 Python 3.2 是 相同 的 , 但 import 语句 可 能 会 改变 。 



































































































































用 对 象 在 一 些 情形 下 

















我 们 会 看 到 一 系列 关于 可 调用 对 象 的 设计 , 并 会 演示 为 什么 有 状态 的 可 调 
比 一 个 简单 的 函数 更 有 用 。 在 编写 自己 的 上 下 文 管理 器 之 前 ， 我 们 也 会 看 一 下 如 何 使 用 Python 中 
些 























内 置 的 上 下 文 管理 器 。 




















5.1 











使 用 ABC 可 调用 对 象 来 进行 设计 


在 Python 中 有 两 种 创建 可 调用 对 象 的 简单 方式 ， 如 下 所 示 。 

























































































@ 使 用 aef 语句 创建 一 个 函数 。 
@ 通过 创建 继承 自 collections.abc.Callable 类 的 实例 。 
也 可 以 将 一 个 变量 赋值 为 lambda 表达 式 。 一 个 lambda 表达 式 是 一 个 小 的 


含 了 一 个 表达 式 语句 。 我 们 不 倾向 于 将 lambda 表达 式 保 存在 变量 

















的 、 
































时 














全 
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import collections .abc 


class Powerl( collections .abc.Callable ) : 


def 


wall +t Selfy KK; Ti }? 
p= 1 
for i in range(n): 


惑 


并 未 使 用 def 语句 定义 的 可 调用 对 象 ， 这 种 做 法 就 会 带 来 困惑 。 


为 当 





匿名 函数 ， 其 中 只 包 
使 用 了 一 个 类 似 函 数 
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p *= x 
return p 
powl= Powerl () 


以 上 的 可 调用 对 象 包含 了 如 下 3 个 部 分 。 

@ 类 继承 自 apc.Callable。 

@ 定义 了 _call () 方 法 。 

@ 创建 了 类 的 实例 powl () 。 

算法 的 确 不 是 很 高 效 ， 我 们 稍 后 会 优化 这 一 点 。 
关 























一 个 完整 的 类 定义 显然 是 不 必要 的 。 为 了 逐步 完成 优化 ， 比 起 把 一 个 函数 重 构 为 可 调用 对 象 ， 











从 一 个 可 调用 对 象 作为 开始 更 容易 入 手 一 些 。 
























































像 使 用 其 他 函数 那样 ， 现 在 可 以 使 用 刚刚 定义 的 pow1 () 函数 了 。 如 下 是 如 何在 Python 命令 行 
中 使 用 powl1 () 函数 的 示例 。 

>>> powl( 2, 0 ) 

1 

>>> powl( 2, 1 ) 

2 

>>> powl( 2, 2 ) 

4 

>>> powl( 2, 10 ) 

1024 

我 们 使 用 了 各 种 各 样 的 参数 值 来 构造 可 调用 对 象 。 如 果 仅仅 是 为 了 创建 abc .callable 子 类 的 
































对 象 ， 这 样 做 是 不 必要 的 。 然 而 ， 这 样 做 可 以 帮助 调试 。 考 虑 如 下 的 定义 。 


class Power2 ( collections.abc.Callable ) : 
def call ( 

p= 1 
for i in range(n): 


Se 计生 大 Cy) 


p *= x 
return p 


以 上 的 类 定义 有 

















个 错误 并 且 不 符合 可 调用 基 类 的 定义 规则 。 


























是 否 找 到 了 这 个 错误 ?如 果 没 有 ， 在 本 章 最 后 会 揭晓 。 





当 我 们 试图 








>>> pow2= 
Traceback 
File 








也 许 无 法 一 下 子 发 现 错误 的 根源 , 但 是 可 以 通过 调试 来 把 它 找 出 来 。 如 果 没 有 继承 


"<stdin>", 
TypeError: 
methods _ 


























使 用 这 个 类 创建 实例 时 ， 会 产生 如 下 错误 。 
Power2 () 
(most recent call last): 
line 1, in <module> 
Can't instantiate abstract class Power2 with abstract 
call | 
































collections. 

















abc.callable 基 类 ， 将 非常 难 调 试 。 
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这 里 就 是 调试 的 难点 ， 我 们 会 跳 过 power3 的 代码 。 和 power2 一 样 ， 唯 一 不 同 的 是 在 没有 继承 





自 collections.abc.Ccallable 的 前 提 下 就 开始 了 类 定义 : class Power3。 
当 试 图 把 power3 作为 一 个 类 来 使 用 时 ， 由 于 此 类 并 没有 满足 可 调用 的 条 件 并 且 没 有 继承 自 



























































abc.Callable， 因 此 将 会 出 现 如 下 错误 。 





>>> pow3= Power3 () 

>>> pow3( 2, 5 ) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 








TypeError: 'Power3' object is not callable 
































关于 power3 的 类 定义 哪里 出 现 了 问题 以 上 错误 只 提供 了 少量 的 信息 。power2 的 错误 信息 




















对 找到 问题 的 根源 更 有 用 一 些 。 
5.2 提高 性 能 


我 们 针对 power3 类 的 性 能 问题 可 以 考虑 两 个 方面 。 


















































了 ， 这 是 可 调用 对 象 的 亮点 。 
第 1 点 改变 是 使 用 分 治 算法 。 在 先前 版 本 中 把 x 拆 分 为 n 个 步 又 ; 


























首先 ， 考 虑 使 用 更 好 的 算法 。 然 后 ， 考 虑 带 有 记忆 的 算法 ， 包 含 缓 在。 因此， 函数 变 得 有 状态 





使 用 循环 计算 每 个 n 的 乘 


法 运算 。 如 果 可 以 找到 把 一 个 问题 划分 为 两 个 相同 子 问题 的 方式 ， 问 题 就 会 被 分 解 为 logzm 个 步骤 。 














对 于 powl (2,1024) ，powerl 函数 中 执行 了 1024 次 2 的 乘法 运算 。 
只 需要 10 次 乘法 计算 ， 无疑 是 显著 的 性 能 提升 。 














我 们 可 以 把 这 个 问题 优化 为 







































































如 果 只 是 简单 地 使 用 一 个 固定 的 值 做 乘法 运算 ， 我 们 会 使 用 “快速 款 ” 算 法 。 它 使 用 了 以 下 3 


























个 基本 逻辑 来 计算 x’”。 
@ 如果 n=0 : x"=1， 结 果 返 回 1。 










































































@ 如 果 n 是 奇数 3 n mod 2 = 1， 结 果 为 x"1'x x。 这 里 包含 了 x! 的 递归 运算 。 这 里 仍 























做 了 一 次 乘法 运算 但 并 非 是 一 个 优化 的 点 。 
























































@ ”如 果 是 偶数 并 且 n mod = 0 ， 结 果 为 x xx”。 这 里 包含 了 x” 的 递归 计算 。 这 里 把 乘 





法 计算 的 数量 减少 了 一 半 。 
以 下 是 一 个 递归 的 、 可 调用 对 象 的 实现 。 























class Power4( abc.Callable ) : 
def call ( self, x, nNn ): 

if n == 0: return 1 

elif n $ 2 == 1: 
rEtUrn Selfs. Callk (xy li=L)* 

else: # n $ 2 == 0: 
t= self. call (x, n//2) 
return txt 
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Pow4= Power4() 

我 们 应 用 以 上 思路 实现 了 快速 究 算 法 。 如 果 n 为 0， 返 回 1。 如 果 n 为 奇数 ， 返 回 递归 调用 的 
XxX"! x x。 如 果 n 为 偶数 ， 返 回 递归 调用 的 x xx。 

执行 效率 显著 提高 了 。 可 以 使 用 timeit 模块 来 查看 性 能 的 对 比 。 在 使 用 timeit 时 ， 需 要 学 
习 一 些 预备 知识 。 当 我 们 分 别 允 许 pow1 (2, 1024) 和 pow4 (2, 1024) 函数 10000 次 进行 对 比 ， 会 
发 现 第 1 个 函数 耗 时 183 秒 而 后 者 只 需要 8 秒 。 加 入 记忆 化 功能 还 可 以 进一步 优化 。 

以 下 是 使 用 timeit 来 进行 性 能 分 析 的 示例 。 


import timeit 
iterative= timeit.timeit( "powl(2,1024)"™,""" 



































































































































import collections.abc 
class Powerl( collections.abc.Callable ) : 
def call ( self, x, nNn ): 
p= 1 
for i in range (n) : 


P *= x 
return p 
powl= Powerl () 
"nn, number=100000 ) # otherwise it takes 3 minutes 
print( "Iterative", iterative ) 

















通过 timeit 模块 ， 可 使 用 timeit .timeit () 函数 来 对 每 行 语句 的 表达 式 进行 耗 时 计算 。 
在 上 例 中 ， 表达 式 为 powl1 (2,1024) 。 而 该 语句 的 上 下 文 是 Powl () 函数 的 定义 , 包含 了 导入 、 类 
定义 和 实例 的 创建 。 
通过 定义 number=100000 来 让 测试 更 快 地 结束 。 如 果 使 用 之 前 例子 的 迭代 数量 ， 几 乎 要 花 两 
分 钟 才能 运行 完毕 。 


记忆 化 与 缓存 

所 请 的 记忆 化 功能 ， 即 缓存 上 一 次 的 计算 结果 为 了 下 次 可 以 重用 。 为 了 提高 性 能 ， 可 考虑 通过 
j 更 多 的 内 存 而 尽量 避免 计算 。 
一 个 普通 的 函数 通常 不 会 缓存 上 次 的 执行 结果 。 函 数 通常 是 无 状态 的 ， 然 而 一 个 可 调用 对 象 可 
以 是 有 状态 的 ， 它 可 以 缓存 上 次 的 执行 结果 。 
如 下 是 power 可 调用 对 象 带 有 记忆 功能 的 实现 版 本 。 


class Power5( collections .abc.Callable ) : 
def init ( self ) : 
self.memo = {} 
def call ( self, x, nN ): 
if (x,n) not in self.memo: 




















































































































使 











A 













































































if n == 
self.memo[x,n]= 1 


9 


elif n % == 1: 


5.3 使 用 functools 完成 记忆 化 ”99 


self.memo[x,n]= self. call (x, n-1) * x 


elif n $ 2 == 0: 
t= :SELF. call, ‘(xy Wi/Y/2) 
self.memo[x,n]= t*t 
elses 








raise Exception("Logic Error") 
return self.memo[x,n 
Pow5= Power5 () 


我 们 修改 了 算法 ， 加 入 了 self.memo 缓存 。 

如 果 x 的 值 之 前 计算 过 ， 再 次 访问 时 将 会 从 缓存 取 而 非 重新 计算 。 这 就 是 之 前 说 的 性 能 提升 
的 地 方 。 

否则 ,x 的 值 必须 被 计算 然后 放 入 缓存 。 计 算 快速 指数 的 3 条 法 则 只 是 操作 缓存 中 的 值 ， 这 使 
得 以 后 的 计算 过 程 可 以 重用 缓存 的 结果 。 
记忆 化 发 挥 的 作用 还 不 止 于 此 。 通 常 使 
对 性 能 的 提升 也 是 显著 的 。 


5.3 使 用 functools 完成 记忆 化 














































































































] 可 调用 对 象 来 蔡 换 执行 速度 缓慢 、 逻 辑 复 杂 的 函数 ， 

















se 























Python 库 的 functools 模块 中 包含 了 记忆 化 的 装饰 器 。 可 以 重用 这 个 模块 而 不 必 新 建 自己 的 
可 调用 对 象 。 
可 像 如 下 代码 这 样 使 用 。 


























from functools import lru cache 
@lru cache (None) 
def Pow6( xn ): 
if n == 0: return 1 
elif n % 2 == 1: 
return Pow6 (x, n-1)*x 
else: # mg 2 == 0: 
t= Pow6 (x, n//2) 
工 全 七 贡 于 站 七 六 七 

















以 上 定义 了 一 个 函数 pow6 ()， 装 饰 了 一 个 最 近 最 少 使 用 (Least Recently Used，LRU) 缓存 。 
会 把 之 前 的 请 求 放 入 缓存 。 请 求 在 缓存 中 的 大 小 是 有 限 的 。 存 入 最 新 的 请 求 ， 移 除 最 近 最 少 使 用 的 
请 求 ， 正 是 LRU 缓存 机 制 的 逻辑 。 

使 用 timeit， 可 以 看 到 pow5 () 函数 执行 10000 次 迭代 需要 大 约 1 秒 ， 而 pow6 () 函数 执行 
相同 次 数 需 要 8 秒 。 

可 以 看 到 这 里 使 用 timeit 时 ， 错 误 地 计算 了 记忆 化 算法 的 性 能 。t imeit 模块 可 以 写 的 更 
复杂 一 些 ， 为 了 在 实际 的 应 用 场景 中 可 以 更 恰当 地 使 用 缓存 。 只 是 简单 的 随机 数 只 对 部 分 问题 模 
型 适用 。 
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使 用 可 调用 API 简化 

一 个 API 只 专注 一 个 方法 ， 正 是 可 调用 对 象 的 思路 。 

一 些 对 象 有 很 多 相关 的 方法 。 例 如 对 于 21 点 中 的 Hand 对 象 ， 需 要 添加 手中 的 牌 并 计算 总 值 。 
21 点 中 的 Playez 需要 下 注 、 接 牌 和 其 他 决定 〈 例 如 ， 叫 牌 、 停 叫 、 分 牌 、 加 保险 、 双 倍 ， 等 等 )。 
这 些 复杂 接口 的 场景 不 适合 使 用 可 调用 对 象 实现 。 

可 考虑 把 投注 策略 作为 可 调用 对 象 。 

投注 策略 可 以 被 实现 为 一 系列 方法 (一些 setter 和 getter 方法 ) 或 者 是 一 个 包含 了 一 些 
公有 属性 的 可 调用 接 

如 下 是 直接 投注 策略 。 


class BettingStrategy : 
def init ( self ) : 
self.win= 0 



































































































































































































































self.loss= 0 
def call ( self ): 
return 1 
bet= BettingStrategy () 














这 个 API 的 逻辑 是 ，Player 的 对 象 会 通知 投注 策略 输赢 的 数量 。Player 对 象 也 可 使 用 如 下 
这 样 的 方法 来 通知 投注 策略 输赢 结果 。 


def win( self, amount ) : 
self.bet.win += 1 




































































self.stake += amount 
def loss( self, amount ) : 

self.bet.loss += 1 

self.stake -= amount 





























这 些 方法 会 通知 投注 策略 对 象 (self.bet 对 象 ) 的 输赢 结果 。 当 需要 下 注 时 ，PILayez 会 使 用 
类 似 如 下 的 操作 来 获取 当前 的 下 注 级 别 。 


def initial bet( self ) : 
return self.bet() 















































这 是 一 个 简短 的 API。 上 毕竟， 投注 策略 只 需 封 装 一 些 相 关 的 、 简 单 的 规则 。 
而 正 是 这 个 接口 实现 的 简短 ， 体 现 了 使 用 可 调用 对 象 所 带 来 的 简洁 和 高 雅 。 对 于 这 样 一 个 简单 
的 逻辑 ， 没 有 定义 太 多 方法 ， 也 没有 使 用 很 多 复杂 的 语法 。 


5.4 可 调用 API 和 复杂 性 


我 们 一 起 看 一 下 这 个 API 是 如 何 应 对 逻辑 
〈 也 称 为 款 投 注 系统 )。 










































































或 





























单 变 为 复杂 的 。 如 下 是 对 于 输 策略 的 加 注 逻 辑 





class BettingMartingale( BettingStrategy ) : 
def init ( self ) : 
self. win= 0 
Self. ] 
self.s 


Loss= 0 
tage= 1 
@property 
def win(sel 


f): return self. win 


Qwin.setter 





def win(self, value): 
self. win = value 
self.stage= 1 
@property 


def loss (self): 
@loss.setter 


return self. loss 


def loss(self, value): 


self. loss value 
self.stage *= 2 
def call ( self ): 


return self.stage 
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通过 将 loss 方法 中 的 stage 乘 2 来 完成 加 注 逻 辑 。 加 注 操作 会 一 直 进 行 ， 直 到 赢 一 局 ， 补 
偿 之 前 的 损失 ;或 者 达到 了 下 注 的 最 大 值 ; 或 者 破产 了 。 玩 牌 时 通常 添加 下 注 最 大 值 来 阻止 不 断 的 
加 注 。 

每 当 赢 一 局 ， 重 置 为 第 1 次 的 下 注 数 额 。 相 应 地 ，stage 变量 也 会 被 重 置 为 1。 

为 了 维护 接口 的 稳定 。 需 要 完成 如 bet .win += 1 这 样 的 代码 逻辑 时 ， 可 通过 创建 特性 来 根 
据 输 赢 的 变化 维护 状态 值 的 改变 。 我 们 只 关心 setter 特性 ， 可 为 了 更 清晰 地 创建 setter 特性 ， 需 
要 定义 getter 特性 。 

可 根据 如 下 代码 这 样 使 用 此 类 。 

>>> bet= BettingMartingale () 

>>> bet () 

下 

>>> bet.win += 1 

>>> bet () 

中 

>>> bet.loss += 1 

>>> bet () 

虽 

API 的 逻辑 仍然 很 简单 ， 如 果 赢 了 ， 赢 的 数量 累加 并 重 置 下 注 对 象 ， 如 果 输 了 ， 输 的 数量 累加 
并 翻 倍 下 注 。 





特性 的 加 入 使 得 类 的 定义 看 起 来 很 爱 肿 。 我 们 
代码 使 用 ”setattr() () 函数 来 简化 类 定义 。 


class BettingMartingale2( BettingStrategy ) : 
def init ( self ) : 























只 关心 setter 而 非 getter， 因 此 可 像 如 下 
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self.win= 0 
self.loss= 0 
self.stage= 1 
def setattr ( self, name, Value ): 
if name == 'win': 
self.stage = 1 
elif name == "1oss ' : 
self.stage *= 2 
super(). setattr ( name, value ) 
def call ( self ): 
return self.stage 

















我 们 使 用 了 setattr () 函数 来 监控 win 和 loss 值 的 变化 。 另 外 ， 使 用 了 super () . 




















_ setattr_ _() 函数 设置 了 实例 变量 值 ， 同 时 也 更 新 了 下 注 数额 。 
这 个 类 定义 更 好 一 些 。 使 用 了 可 调用 对 象 中 的 两 个 属性 来 作为 API。 


5.5 管理 上 下 文 和 with 语句 

























































































在 Python 中 ,在 很 多 地 方 用 到 了 上 下 文 的 管理 。 接 下 来 会 结合 一 些 示 例 来 对 基本 用 法 进行 


说 明 。 








上 下 文 是 通过 with 语句 来 定义 的 。 以 下 的 这 个 例子 中 使 用 了 一 个 程序 解析 日 志文 件 并 保存 为 






































CSV 格式 。 由 于 需要 同时 打开 两 个 文件 ， 
了 复杂 的 正则 表达 式 format_1_pat。 接 下 来 会 进行 说 明 。 
这 个 程序 的 实现 代码 如 下 。 


import gzip 





Bs 


























import csv 
with open("subset.csv", "w") as target: 
wtr= csv.writer( target ) 


with gzip.open(path) as source: 


line iter= (b.decode() for b in source) 

match iter = (format 1 pat.match( line ) for line in 
line iter) 

wtr.writerows( (m.groups() for m in match iter if m is not 
None) ) 





























这 里 使 用 了 两 个 上 下 文 管理 器 。 
外 部 的 上 下 文 以 with open ("subset.csv"，"w") as target 为 起 始 。 使 用 Python 
open () 函数 打开 一 个 文件 ， 赋 值 给 target 变量 以 备 后 用 。 
内 部 的 上 下 文 以 with gzip.open (path，"r") as source 为 起 始 。gzip.open () 
和 open () 函数 的 行为 是 类 似 的 ， 也 是 打开 一 个 文件 赋值 给 一 个 上 下 文 管 理 器 。 
当 with 语句 结束 ， 上 下 文 也 会 相应 终止 并 关闭 引用 的 文件 。 即 使 当 with 上 下 文中 有 异 
出 ， 上 下 文 管理 器 也 会 正常 终止 并 相应 关闭 所 引用 的 文件 。 
































7 









































































































































此 需要 使 用 嵌 套 的 with 语句 来 创建 上 下 文 。 下 例 使 用 




















中 的 








常 抛 
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总 是 使 用 with 语句 来 操作 文件 
Q 既然 文件 属于 系统 资源 。 当 应 用 程序 不 再 使 用 系统 资源 时 ， 需 要 
及 时 释放 ， 这 点 是 重要 的 。with 语句 可 以 确保 资源 被 正确 释放 。 





















































为 了 完成 上 例 ， 如 下 代码 是 用 来 将 Apache HTTP 服务 器 日 志文 件 解析 为 通用 日 志 格 式 〈Common 
Log Format) 的 正则 表达 式 。 


import re 














format 1 pat= re.compilel( 


) 


r"([\d\.]+)\s+" # digits and .'s: host 
rNSE) NstE™ # non-space: logname 





r"(\S+) NSs+" # non-space: user 
r"\[(.+?)\]\s+t" # Everything in []: time 
(Nt # Everything in "": request 
r"(\d+) NSs+" # digits: status 

r"(\S+)\s+t" # non-space: bytes 
Es # Everything in "": referrer 
F(T NS # Everything in "": user agent 
































以 上 表达 式 实现 了 不 同日 志 格 式 中 字段 的 解析 ， 正 是 之 前 例子 中 使 用 的 。 


Sal 











使 用 小 数 上 下 文 














另 一 个 经 常 使 用 的 上 下 文 的 例子 是 小 数 上 下 文 。 它 定义 了 很 多 decimal .Decimal 计算 的 特性 ， 
包含 了 大 量 的 规则 用 来 求 近似 值 或 对 值 进行 截取 。 
考虑 如 下 实现 。 


import decimal 
PENNY=decimal.Decimal ("0.00") 











price= decimal .Decimal ('15.997') 
rate= decimal.Decimal('0.0075"') 


print( "Tax=", (price*rate) .quantize (PENNY), "Fully=", price*rate 


) 


with decimal.localcontext () as ctx: 


上 僵 


ctx.rounding= decimal .ROUND DOWN 
tax= (price*rate) .quantize (PENNY) 


print( "Tax=", tax ) 
1 中 演示 了 默认 上 下 文 和 本 地 上 下 文 。 默认 上 下 文 有 默认 的 求 近似 值 的 规则 。 而 本 地 上 下 文 
































演示 了 通过 对 特殊 计算 设置 小 数 的 近似 规则 来 确保 操作 的 一 致 性 
with 语句 用 来 确保 当 本 地 上 下 文 改 变 时 原来 的 上 下 文 可 以 复原 。 在 这 个 上 下 文 之 外 ， 应 用 











o 













































































默认 的 求 近似 值 规则 。 在 上 下 文 之 内 ， 应 用 自己 特殊 的 近似 值 规则 。 
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5.5.2 其 他 上 下 文 














如 希望 数据 库 事务 可 以 在 执行 成 功 时 提交 ， 抑 或 在 失败 时 














共 的 上 下 文 。 几 乎 它 








门 所 有 都 涉及 基本 的 输入 /输出 操作 。 大 多 数 模块 打开 一 
下 文 和 一 个 类 似 文件 的 对 象 。 




















有 务 也 会 用 到 上 下 文 。 有 时 会 需要 释放 一 个 外 部 锁 ， 比 如 一 个 semaphore， 再 










































































还 有 一 些 其 他 公 
个 文件 ， 创 建 一 个 上 

锁 和 数据 库 的 事 
中 定义 好 了 。 

PEP343 文件 提供 了 很 多 划 
些 特 殊 场 景 中 用 到 。 
















































































里 功能 的 类 。 








我 们 也 可 能 只 是 创建 一 些 上 下 文 管理 器 的 类 ， 
与 file () 对象 是 类 似 的 。 我 们 

我 们 会 在 第 8 章 “ 装 饰 器 和 mixin 一 一 横 切 方面 ”对 这 点 进行 
有 上 下 文 管 








或 者 创建 含有 多 个 
会 看 到 很 多 上 下 文 的 设计 方法 。 














回 滚 。 这 些 都 已 经 在 Python 中 的 上 下 文 











他 使 用 with 语句 和 上 下 文 管理 器 的 例子 , 这 些 用 法 也 许 会 在 其 他 一 


























er” 


























j 意 的 类 ， 其 中 之 一 是 上 下 文 














I 











顾 ， 会 介绍 多 种 方式 来 创建 





5.6 定义 _enter 0 站 和 exit 0 方法 


上 下 文 管理 器 的 定义 








包含 两 个 特殊 方法 : 


enter 











() 和 exit with 语句 使 ) 





() 。 它们 
















































































































































































进行 上 下 文 的 进入 和 退出 。 接 下 来 会 通过 一 个 示例 来 进行 说 明 。 

我 们 经 常 使 用 上 下 文 管理 器 来 执行 短暂 的 全 局 修改 。 可 能 是 数据 库 事务 状态 的 改变 或 者 是 锁 状 
态 的 改变 ， 亦 或 一 些 事情 ， 只 希望 在 事务 结束 前 执行 的 逻辑 ， 而 事务 结束 后 可 以 被 移 除 。 

接 下 来 的 例子 中 ， 在 全 局 上 改变 了 随机 数 生成 器 。 我 们 会 创建 一 个 上 下 文 ， 在 这 个 上 下 文 内 随 
机 数 生 成 器 使 用 一 个 固定 的 、 已 知 的 随机 种 子 来 生成 固定 的 值 。 

以 下 是 这 个 上 下 文 管理 器 类 的 定义 。 

import random 

class KnownSequence: 


def init (self, seed=0): 


def 





的 状态 并 将 利 


self.seed= 0 
enter (self): 


self.was= random.getstate() 


random.seed(self.seed, 


return self 


version=1) 


_ exit (self, exc type, exc value, traceback): 


random.setstate(self.was) 





























我 们 定义 了 所 需 的 _enter () 和 exit  () 方 法 。 enter () 方 法 会 保存 随机 模块 上 次 
F 子 重 置 为 设 定 的 值 。 exit _() 方 法 用 于 恢复 随机 数 生成 器 之 前 的 状态 。 
__enter _() 方 法 返回 了 self。 这 点 对 于 被 添加 到 了 其 他 类 定义 中 的 mixin 上 下 文 


Ce 
注 原 ， 





各 全 














YH 


























里 器 来 说 是 常见 的 。 我 们 会 在 第 8 章 “ 装 蚀 




















器 和 m 


ixin 一 一 横 切 方面 ”中 进行 介绍 。 
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_ exit () 方 法 的 参数 值 在 正常 情况 下 会 被 赋值 为 None。 除 非 我 们 有 特殊 的 异常 处 理 需 要 ， 


我 们 通常 会 忽略 参数 值 。 在 以 下 

















这 里 是 
print( 








with KnownSedquence () : 


print 


print( 


( tuple (random.ra 


tuple (random.randin 


with KnownSedquence () : 


print 


print( 





( tuple (random.ra 





tuple (random.randin 























个 使 用 上 下 文 的 例子 。 


tuple (random.randint 








尺码 中 介绍 异常 处 理 


ndint (-1,36) 
t(-1,36) for i in range(5)) ) 


ndint (-1,36) 
t(-1,36) for i in range(5)) ) 














的 过 程 。 


























-1,36) for i in range(5)) ) 


for i in range(5)) ) 


for i in range(5)) ) 


每 次 创建 一 个 KnownSequence 的 实例 ， 修 改 了 random 模块 的 实现 。 在 withn 语句 的 上 








下 文中 ， 会 


的 数值 。 


























(23, 25, 


输出 


(6, 36, 


(23, 25, 


(9， 


以 上 结果 


7v 















































寻 为 种 





























可 能 会 是 如 下 这 样 〈 大 多 数 情况 下 )。 


(125 OF 天 人 二 0) 
1, 15, 31) 
1, 34, 8) 
1, 15, 31) 
lL3n .22;-29.) 











导 到 一 串 固定 的 随机 数 。 而 在 上 下 文 之 外 ， 由 





























能 会 因 机 器 不 同 而 改变 。 然 而 其 





于 随机 种 子 被 复原 了 ， 因 此 会 得 到 随机 




















他 行 可 能 会 不 一 样 ， 可 第 2 行 与 第 4 行 一 定 是 一 致 





























己 经 在 上 下 文中 被 固定 了 。 其 他 行 没 必要 相同 ， 因 为 它们 取决 于 随机 模块 自身 的 随机 











抛 出 的 异常 会 传 给 上 下 文 管理 器 中 的 _exit__() 函数 。 异常 的 标准 信息 一 一 类 , 参数 和 追踪 栈 


一 一 都 会 作为 参数 值 传 入 。 
_ exit__() 方 法 可 以 使 用 蜡 常 信 息 做 如 下 两 件 事情 。 


























































































































允许 异常 向 上 冒 泡 。 


@ 通过 返回 一 些 True 的 值 把 异常 吞 掉 。 
@ ”通过 返回 

都 是 一 个 False 值 ， 这 将 
异常 也 可 用 于 改变 上 下 文 管理 


些 特殊 的 逻辑 处 理 。 









































器 在 退 





5.7 上 下 文 管理 器 工厂 





























可 以 创建 一 个 上 下 文 管理 器 类 来 作为 应 用 程序 对 象 的 工厂 。 
需 在 应 用 程序 类 编写 过 多 有 关上 下 文 管理 器 功能 的 逻辑 。 













































































其 他 一 些 False 的 值 允许 异常 正常 抛 出 。 什 么 都 不 返回 和 返回 None 是 一 样 的 ， 














时 的 行为 。 比 如 ， 可 能 希望 当 OS 抛 出 错误 时 可 以 做 一 


这 样 的 设计 使 得 耦合 降低 ， 而 且 无 
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假如 需要 一 个 Deck 类 来 完成 21 点 中 的 发 牌 。 可 它 并 非 像 听 起 来 那样 有 用 。 对 于 单元 测试 ， 
将 需要 一 个 完整 的 、 模 拟 的 geck 对 象 和 特殊 序列 的 牌 。 它 有 一 个 优势 ， 正 如 之 前 看 到 的 ， 可 以 和 
上 下 文 管理 器 类 一 起 工作 。 


我 们 将 扩展 以 上 演示 的 简单 上 下 文 管理 器 : 创建 Deck 类 , 它 可 以 在 with 语句 上 下 文中 























































































































使 用 














以 下 是 一 个 类 ， 它 是 Deck 的 了 





[ 厂 ， 改 变 了 random 模块 的 实现 。 
class Deterministic Deck: 
def _ init ( self, *args, **kw ): 
self.args= args 
Self.kw= kw 
def enter ( self ): 





self.was= random.getstate() 
random.seed!( 0, version=1 ) 


return Deck( *self.args, **self.kw ) 


_ exit ( self, exc type, exc value, traceback ) : 
random.setstate( self.was ) 


以 上 的 上 下 文 管理 器 类 存 了 参数 值 ， 为 了 用 于 创建 Deck。 


_enter _() 方 法 存 了 旧 的 随机 数 状 态 ， 然 后 将 随机 数 模 块 的 逻辑 改 为 : 产生 固定 的 随机 值 
用 来 创建 和 洗 牌 。 












































TT 








注意 ”enter () 方 法 返回 了 一 个 新 的 Deck 对 象 ， 用 于 witn 语句 的 上 下 文中 ， 并 使 用 witn 
的 as 语句 为 其 赋值 。 

也 可 以 考虑 另 一 种 方式 达到 同样 的 目的 。 可 以 在 Deck 类 中 创建 一 个 random. Random (x=seed) 
实例 。 它 也 会 工作 ， 由 于 代码 仅 用 于 展示 ， 使 得 Deck 类 显得 更 混乱 。 

以 下 是 使 用 这 个 上 下 文 管理 器 工厂 的 方式 。 






















































































with Deterministic Deck( size=6 ) as deck: 


h = Hand( deck.pop(), deck.pop(), deck.pop() ) 


之 前 的 代码 示例 保证 了 在 演示 时 可 以 产生 特定 的 牌 。 
上 下 文 管理 磺 的 清理 









































在 本 节 中 ， 将 会 讨论 一 些 有 关上 下 文 管 



























































里 器 复杂 的 应 用 场景 ， 当 遇 到 异常 时 会 尝试 执行 清 
理 操 作 。 
这 样 可 以 解决 一 个 常见 的 问题 : 希望 想 保 存 应 用 程序 正在 写 的 一 个 文件 的 副本 。 正 如 以 下 代码 
所 示 





with Updating( "some file" ) : 
with open( "some file", "w" ) 


process( target ) 


as target: 




















日 的 是 将 原文 件 重 命名 为 some_file copy 并 备份 。 如 果 上 下 文 ! 




















一 切 正常 (没有 异常 ) 


5.8 总结 


然后 删除 备份 文件 或 重 命名 为 some_file olg。 












































命名 旧 文 件 为 some_file， 并 把 抛 出 异常 前 的 原文 件 复 得 
将 需要 如 下 这 样 的 上 下 文 管理 器 。 














配 





Co 


























import os 
class Updating: 
def init ( self, filename ) : 
self.filename= filename 
def enter ( self ): 
try: 





self.previous= self.filename+" copy" 





os.rename( self.filename, self.previous ) 

except FileNotFoundError: 
# Never existed, no previous copy 
self.previous= None 

def exit ( self, exc type, exc value, traceback ) : 

if exc type is not None: 

trEy: 
os.rename( self.filename, self.filename+ " error" ) 

except FileNotFoundError: 





pass # Never even got created? 
if self.previous: 


os.rename( self.previous, self.filename ) 




















这 个 上 下 文 管理 器 的 _enter _() 方 法 会 试图 对 之 前 的 文件 进行 备份 (如 果 它 已 经 存在 )。 

















果 它 不 存在 ， 就 不 会 有 任何 行为 。 
_ exit__() 方 法 用 来 接收 从 上 下 文中 抛 出 的 异常 信 ， 














































































































用 “error” 为 后 级 )， 为 了 之 后 的 调试 。 它 也 会 将 异常 前 保存 的 文件 复制 区 
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如 果 上 下 文 没 有 正常 工作 一 一 出 现 了 异常 一 一 我 们 需要 重 命名 新 文件 为 some_file error 3 


如 


妃 。 如 果 没 有 异常 , 将 返回 之 前 保存 的 
文件 ， 同 时 上 下 文中 创建 的 文件 也 会 被 保留 。 如 果 出 现 异 常 ， exit _() 方 法 将 保存 输出 (使 











这 个 功能 和 try-except-finally 语句 是 等 价 的 。 然 而 ， 它 具备 一 个 优势 ， 分 离 了 应 | 




























































































在 男 一 个 类 中 处 理 。 








5.8 总 结 



























































序 的 相关 处 理 和 上 下 文 的 管理 逻辑 。 应 用 程序 处 理 在 with 语句 内 部 中 完成 。 而 上 下 文 的 问题 被 放 


我 们 看 了 类 定义 中 的 3 个 特殊 方法 。 call _() 方 法 用 于 创建 一 个 可 调用 对 象 ， 可 调用 对 象 




















用 于 创建 有 状态 的 函数 。 之 前 的 例子 中 定义 了 可 以 记忆 之 前 计算 结果 的 函数 。 









































enter () 和 ”exit () 函数 用 来 创建 上 下 文 管理 器 ， 上 下 文 用 于 处 理 with 语句 中 的 逻 
辑 处 理 ， 之 前 的 大 多 数 例子 包含 了 输入 和 输出 。 然 而 ， 在 Python 中 ， 对 于 一 些 场景 使 用 局 部 上 下 






























































文 处 理 起 来 很 方便 。 接 下 来 会 介绍 如 何 创建 容器 和 集合 。 
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第 5 章 可 调用 对 象 和 上 下 文 的 使 用 


5.8.1 可 调用 对 象 的 设计 要 素 和 折 中 方案 
在 设计 一 个 可 调用 对 象 时 ， 需 要 考虑 以 下 几 点 。 





@ 首 


先是 API。 如 果 

































































个 对 象 使 用 函数 式 接口 更 好 一 些 ， 那 么 使 用 可 调用 对 象 是 合理 的 。 通 





















































































































































过 使 用 collections.abc.Ccallable 来 确保 可 调用 API 被 正确 地 创建 ,并 且 可 以 让 读 
代码 的 人 很 明确 地 了 解 类 的 目的 。 
@ 其 次 是 函数 的 状态 。Python 中 的 普通 函数 没有 迟滞 性 一 一 没有 保存 的 状态 ， 而 可 调用 对 象 
可 以 保存 状态 ， 记 忆 化 设计 模式 很 好 地 应 用 了 有 状态 的 可 调用 对 象 。 
可 调用 对 象 唯 一 的 缺点 就 是 需要 的 语法 更 多 了 。 而 一 个 普通 函数 的 定义 显得 更 简洁 、 出 错 概率 
小 并 且 可 读 性 更 强 。 
把 一 个 普通 函数 转换 为 可 调用 对 象 是 很 容易 的 ， 比 如 这 个 函数 。 




















def x(args): 


body 


之 前 的 函数 可 以 被 转换 为 下 




















掉 的 可 调用 对 象 。 


class X(collections.abc.callable): 


def call (self, args): 
body 


x= X() 











在 不 破坏 单元 测试 的 情况 下 ， 以 上 的 改动 是 最 小 的 。 而 body 中 的 























中 正常 运行 。 




















尺码 可 以 直接 在 新 的 上 下 文 

















旦 完成 修改 ， 新 功能 就 会 被 添加 到 可 调用 对 象 实现 版 本 的 函数 中 。 


5.8.2 上下文 管理 器 的 设计 要 素 和 折 中 方案 












































上 下 文通 常用 于 获取 /释放 、 打 玫 
相关 的 ， 而 且 Python 中 日 
对 于 包含 了 多 个 处 理 步 又， 而 每 步 又 包含 】 








是 对 于 最 终 需要 调用 close () 方法 的 逻辑 ， 应 该 包含 在 上 下 文 管理 
F/ 关 闭 操作 ， 可 其 


Python 中 
shelve 模块 ， 


的 一 些 类 届 


就 没有 创建 























F/ 关 闭 和 加 锁 /解锁 这 类 的 操作 对 。 大 多 数 操作 是 与 文件 的 IO 
的 大 多 数 文件 操作 对 象 已 经 是 不 错 的 上 下 文 管理 器 了 。 



































括号 的 逻辑 来 说 ， 上 下 





文 管理 器 总 是 需要 的 。 特 别 



















































































可 以 而 








EF 提供 了 打 玫 
个 上 下 文 。 



































应 该 ) 在 操作 shelve 文件 时 使 用 contextllib.clos 








9 章 “ 序 列 化 和 保存 一 一 JSON、YAML、Pickle、CSV 和 XML”， 
() 方法 的 类 ， 





对 于 需要 close 





的 类 ， 
村 











可 以 使 月 

















锅 中 。 
的 对 象 并 不 是 上 下 文 对 象 。 比 如 对 于 


ing() 上下文。 我们 会 在 第 








对 这 一 点 进行 介绍 。 
有 closing () 函数 。 对 于 生命 周期 
可 以 在 _init __() 方 法 或 类 级 别 的 open () 方法 中 获取 资源 ， 然 后 在 close () 中 释放 。 这 
一 来 ， 类 就 可 以 和 closing () 函数 很 好 地 集成 了 。 














包含 有 获取 /释放 
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以 下 是 一 个 类 封装 的 例子 ， 内 部 包含 了 close () 函数 。 


with contextlib.closing( MyClass() ) as my object: 
process( my object ) 


context1lib.closing() 函数 会 调用 参数 对 象 的 close () 方 法。 其 
了 close () 方 法。 


5.8.3 ”展望 


在 接 下 来 的 两 章 里 ， 会 介绍 如 何 使 用 特殊 函数 创建 容器 和 数字 。 在 第 6 章 “ 创 建 容器 和 集合 ” 
中 , 会 详细 介绍 标准 类 库 中 的 容器 和 集合 ,也 会 演示 如 何 创建 唯一 的 、 新 的 容器 类 型 。 在 第 7 草创 


》 


建 数值 类 型 ”中 ， 会 介绍 不 同 的 数值 类 型 以 及 如 何 创建 自 定 义 的 数值 类 型 。 

















，my_object 中 包含 




















































































































第 6 章 
创建 容器 和 集合 

















我 们 可 以 通过 扩展 不 同 的 抽象 基 类 的 方式 来 创建 新 的 集合 。 抽 象 基 类 为 我 们 提供 了 扩展 内 置 容 
器 的 基本 准则 。 这 让 我 们 可 以 修改 现 有 的 属性 或 者 重新 定义 更 加 符合 我 们 需求 的 新 数据 结构 。 

我 们 会 介绍 容器 的 抽象 基 类 的 基本 知识 。Python 使 用 了 很 多 抽象 基 类 来 组 合 内 置 类 型 ， 例 如 
list、 tuple、 dict、set 和 frozenset。 

我 们 会 重 温 各 种 与 创建 容器 相关 或 者 为 容器 提供 了 不 同 功 能 的 特殊 方法 。 我 们 会 将 这 些 方法 单独 
归 类 为 核心 容器 方法 ， 与 一 些 用 于 sequence、map 和 set 的 特殊 方法 区 分 开 。 

我 们 会 着 重 介 绍 如 何 通 过 扩展 容器 的 方式 往 容 器 类 中 添加 新 的 属性 。 我 们 还 会 介绍 如 何 封装 内 
置 容器 并 将 方法 的 行为 从 封装 类 委托 给 基础 容器 。 

最 后 ， 我 们 会 介绍 如 何 创建 全 新 的 容器 。 这 是 很 有 挑战 的 一 个 部 分 ， 因 为 Python 标准 库 中 已 
经 内 置 了 许多 非常 有 用 而 且 功 能 强大 的 集合 算法 。 为 了 避免 涉及 过 深 的 计算 机 科学 知识 ， 我们 会 创 
建 一 个 非常 简陋 的 集合 。 开 始 在 真实 的 应 用 中 创建 我 们 自己 的 容器 之 前 ， 很 有 必要 认真 地 学 习 
Cormen、Leiserson、Rivest 和 Stein 所 著 的 Introduction to Algorithms。 


在 结束 本 章 之 前 ， 我 们 会 总 结 一 些 在 扩展 或 者 创建 新 的 集合 时 需要 考虑 的 设计 要 素 。 


6.1 集合 的 抽象 基 类 


collections .abc 模块 提供 了 很 多 抽象 基 类 ， 这 些 类 将 集合 分 解 成 许多 互相 独立 的 属性 外 
即使 不 深入 地 考虑 不 同 的 属性 以 及 它们 和 set 类 以 及 dict 类 的 关系 ， 我 们 仍然 可 以 顺利 地 
使 用 1ist 类 。 但 是 ， 一 旦 我 们 开始 探究 这 些 抽象 基 类 ， 就 会 发 现 这 些 类 有 一 些微 妙 之 处 。 由 于 将 
集合 的 不 同 概念 独立 地 分 解 出 来 ， 即 使 在 不 同 的 数据 结构 之 间 ， 我 们 也 可 以 看 到 一 些 重复 的 地 方 ， 
但 却 都 声称 自己 是 优雅 的 多 态 实现 。 
在 这 些 基 类 的 最 后 是 一 些 “ 只 会 一 招 的 小 马 ”(one-trick pony) 定义 。 这 些 只 包含 一 个 特殊 方法 的 
基 类 有 如 下 几 种 。 
@ Container 基 类 要 求 子 类 实现 contains () 方 法 ,这 个 特殊 方法 实现 了 in 运算 符 。 
@ Iterable 基 类 要 求 子 类 实现 iter () 方 法 。for 语句 、 生 成 器 表达 式 和 iter () 
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6.2 ”特殊 方法 示例 ”111 




















函数 都 需要 使 用 这 个 方法 。 

@ Sizeqd 基 类 要 求 子 类 实现 len () 方 法 。 len() 函数 需要 使 用 这 个 方法 , 它 也 很 稳妥 地 
实现 了 _bool _() 方 法 ， 但 是 这 个 方法 不 是 必需 的 。 

@ Hashable 基 类 要 求 子 类 实现 hash _() 方 法 。hash () 函数 需要 使 用 这 个 方法 ， 如 果 这 个 

方法 被 实现 了 ， 就 意味 着 当前 对 象 是 不 可 变 的 。 

这 些 抽象 基 类 都 是 用 来 建立 可 以 直接 在 我 们 的 程序 中 使 用 且 层 次 更 高 的 复合 结构 。 这 些 复 合 结构 包 

括 了 低层 次 的 基 类 sized、Iterable 和 Container。 下 面 是 一 些 可 能 在 程序 中 直接 使 用 的 复合 基 类 。 










































































































































































@ Sequence 和 MutableSequence 类 ， 它 们 是 基于 例如 inqex() 、count () 、 
revVverse () 、extend() 和 remove () 这 些 方法 创建 的 ， 同 时 也 包含 了 这 些 方法 的 实现 。 
@ Mapping 和 MutableMapping 类 ,这 两 个 类 包含 了 例如 keys()、items () 、values ()、 
get () 和 其 他 的 一 些 方法 的 实现 。 
@ Set 和 MutableSet 类 包含 了 用 于 set 类 型 的 比较 操作 和 算术 运算 符 的 实现 。 
如 果 我 们 深入 地 探究 一 下 内 置 的 集合 , 我 们 就 能 发 现 抽象 基 类 是 如 何 组 织 我 们 需要 重 写 或 者 修 
改 的 特殊 方法 的 。 


6.2 ”特殊 方法 示例 
通过 观察 21 点 中 的 Hana 对 象 ， 会 发 现 有 一 个 很 有 趣 的 关于 包含 关系 的 例子 。 我 们 常常 会 想 


知道 玩家 的 手中 是 否 有 ace。 如 果 我 们 用 扩展 1ist 的 方式 来 定义 Hang， 那 么 我 们 就 不 能 直接 查 
询 是 
























































































































































否 有 ace。 取 而 代 之 的 是 ， 我 们 只 能 查询 某 张 牌 。 我 们 不 想 写 类 似 下 面 这样 的 代码 。 

















any( cardl(1,suit) for suit in Suits ) 


这 似乎 是 一 种 寻找 ace 的 很 雄 烦 的 方法 。 
下 面 是 一 种 更 好 的 方法 ， 但 是 ， 它 或 许 还 是 有 一 些 不 够 完美 。 











> 

















any( c.rank == 'A' for c in hand.cards ) 

















] 下 面 这 样 的 方法 。 








Se 


所 以 ， 我 们 实际 上 只 是 想 

'A' in hand.cards 

这 意味 着 ,我们 试图 修改 1ist 中 对 于 “包含 ”的 定义 。 我 们 并 没有 查询 一 个 card 实例 ， 我 们 
只 是 在 查询 一 个 card 对 象 的 rank 属性 。 我 们 可 以 通过 重 写 _contains () 方 法 实现 。 




















def contains ( self, rank ) : 
return any( c.rank==rank for rank in hand.cards ) 








这 个 实现 让 我 们 可 以 用 一 个 简单 的 in 在 nand 对 象 中 查找 给 定 的 rank。 
类 似 的 设计 也 会 用 在 _iter () 和 ”1len () 这 两 个 特殊 方法 中 。 但 是 , 请 注意 ,改变 len () 


























的 语义 和 更 改 一 个 集合 与 for 交互 的 方式 可 能 是 一 个 非常 糟糕 的 设计 。 




















112 第 6 章 创建 容器 和 集合 


6.3 使 用 标准 库 
































的 扩展 

















































































































































































































































































































































































































































































































我 们 会 介绍 标准 库 中 一 些 对 内 置 类 型 的 扩展 实现 。 这 些 是 扩展 或 者 修改 了 内 置 集合 类 的 类 型 。 在 
诸如 Python 3 Object Oriented Programming 这 样 的 书 中 ， 己 经 用 不 同 的 方式 介绍 了 它们 中 的 大 多 数 。 
我 们 会 介绍 下 面 6 个 集合 函数 。 
@ namedtuple() 函数 会 创建 允许 包含 可 命名 属性 的 tuple 类， 我 们 可 以 使 用 这 个 函数 而 
不 是 额外 完整 地 定义 一 个 仅仅 为 属性 值 命名 的 类 。 
@ deque〔 注 意 这 种 不 规则 的 拼写 方式 〉 是 一 个 双 端 队列 ， 一 个 类 似 List 的 集合 ， 但 是 可 以 在 
任何 一 段 快 速 地 进行 增加 和 弹出 操作 。 可 以 用 这 个 类 的 其 中 一 部 分 属性 来 创建 常规 的 栈 或 队列 。 
@ 在 一 些 情况 下 ， 我 们 可 以 使 用 chainMap， 而 不 是 合并 不 同 的 映射 。 这 是 一 个 将 多 个 映射 
连接 起 来 的 方法 。 
@ 一 个 orderedDict 集合 是 会 保持 所 有 元 素 原 始 插入 顺序 的 一 种 映射 。 
@ defaultDict〔 注 意 这 种 不 规则 的 拼写 方式 ) 是 dict 的 一 个 子 类 ， 它 内 部 使 用 一 个 工 
厂 函 数 为 所 有 没有 值 的 键 提 供 默认 值 。 
@ Counter 也 是 一 个 dict 的 子 类 ， 它 可 以 被 用 来 统计 对 象 ， 进 而 创建 频率 表 。 但 是 ， 它 
实际 上 是 一 个 更 复杂 的 数据 结构 ， 通 常 我 们 称 为 多 重 集合 (multiset) 或 者 包 (bag )。 
我 们 会 看 到 上 述 每 一 个 集合 的 示例 。 通 过 学 习 这 些 库 集合 ， 我 们 应 该 学 会 很 重要 的 两 课 。 
@ ”什么 是 已 经 存在 而 不 需要 我 们 自己 重新 创建 的 。 
@ ”如 何 通 过 扩展 抽象 基 类 的 方式 向 Python 语言 中 添加 有 趣 且 有 用 的 新 结构 。 
同时 ， 阅 读 库 的 源码 也 非常 重要 。 这 些 源 码 会 向 我 们 展示 许多 Python 中 使 用 的 面向 对 象 编程 
技术 。 除 了 这 些 基本 的 集合 外 ， 主 要 就 是 模块 了 ， 如 下 所 述 。 
@ Heapq 模块 是 包含 了 一 系列 将 堆 队 列 (heap queue) 的 属性 添加 到 一 个 现 有 的 1ist 对 象 
上 的 函数 。 堆 队列 的 不 变性 是 指 堆 上 的 所 有 元 素 按 顺序 存储 ， 这 样 可 以 对 扒 队 列 进行 升序 的 
快速 检索 。 如 果 我 们 在 一 个 1ist 结构 上 使 用 heapa 方法 ， 我 们 就 不 再 需要 显 式 地 排序 列 
表 。 这 个 方法 可 以 带 来 很 大 的 性 能 提升 。 
@ array 模块 是 一 种 对 特定 值 的 存储 方式 进行 优化 的 序列 ， 这 为 包括 了 大 量 简单 值 的 集合 提 
供 了 一 些 类 似 列 表 的 特性 。 
6.3.1 namedtuple(0 畏 数 
namedtuple () 函数 根据 提供 的 参数 创建 一 个 新 类 。 这 个 类 会 有 一 个 类 名 ， 一 些 字段 名 和 一 














对 可 选 的 用 了 
使 用 























定义 类 行为 的 关键 
namedtuple () 会 将 类 定义 浓缩 成 如 

















[== 


子 。 





























名 属性 的 时 候 ， 它 让 我 们 不 用 再 编写 见长 而 复杂 的 类 定义 。 





E 一 个 很 短 的 不 可 变 对 象 的 定义 中 。 在 我 们 需要 一 组 命 


比如 ， 对 于 打牌 ， 我 们 可 能 会 想 将 下 面 的 代码 加 入 类 定 








6.3 ”使 用 标准 库 的 扩展 “113 


























from collections import namedtuple 


义 中 。 





BlackjackCard = namedtuple('BlackjackCard', 'rank, suit,hard, soft') 





我 们 定义 了 一 个 新 的 类 ， 它 带 有 4 个 命名 属性 : rank、suit、narqd 和 soft。 由 于 这 些 对 象 都 是 




















不 可 变 的 ， 因 此 我 们 不 需要 担心 一 个 不 守 规矩 的 程序 试 




















图 修改 一 个 BlackjackCard 





我 们 可 以 用 一 个 工厂 函数 创建 这 个 类 的 不 同 实例 ， 如 下 所 示 。 





def card( rank, suit ) : 


if rank == 1: 


elif 2 <= rank < 11: 


elif rank == 11: 


elif rank == 12: 





elif rank == 13: 


return BlackjackCard( 'A', suit, 1, 11 


return BlackjackCard( strl(rank), suit, 


) 


rank, rark ) 


return BlackjackCard( 'J', suit, 10, 10 ) 


return BlackjackCard( 'Q', suit, 10, 10 ) 














return BlackjackCard( 'K', suit, 10, 10 ) 








上 面 的 代码 会 根据 不 同 的 牌 面 值 创 建 带 有 正确 软 总 和 和 

















过 | 















































种 模板 都 是 以 类 似 下 面 这 样 的 代码 开始 的 。 











class TheNamedTuple (tuple): 


_slots = () 
_fields = {field names!r} 
def new (cls, {arg list}): 
return tuple. new (cls, ({arg list}) 














模板 代码 扩展 了 内 置 的 tuple 类 ， 这 里 没有 其 他 特殊 上 


它 将 ”slots_ 设 为 空 元 组 。 有 两 种 方式 来 管 


slots 



































) 


地方。 





























里 实例 变量 : 








便 总 和 的 Blackjackcard 实例 。 通 
不 同 的 参数 填充 tuple 的 子 类 模板 ， 最 终 会 创建 一 个 名 为 namedtuple 的 新 类 。 基 本 上 ， 这 











实例 的 rank 值 。 














\ 也 






































”slots 和 dict 。 通 过 设置 


，__qdict 被 禁止 修改 ， 同 时 也 保证 了 不 会 有 新 的 实例 变量 被 添加 到 这 个 类 的 对 象 


























用 于 接收 字段 名 列表 。 
模板 定义 了 一 个 _new__() 方 法 用 来 初始 化 不 可 变 对 象 。{arg_1list} 被 
建 每 个 实例 的 参数 列表 。 
还 有 其 他 的 





类 











。 此 外 ， 生 成 的 对 象 依然 保持 在 最 小 的 大 小 。 












































模板 中 创建 了 一 个 名 为 fields 的 类 级 变量 , 这 个 变量 用 于 为 类 中 的 字段 命名 。{ fielg names !r} 















































添加 新 的 











门 可 以 继承 一 个 namedtuple 类 , 然后 添加 新 的 











下 面 是 一 个 继承 namedtuple 类 的 例子 : 














来 接收 定义 如 何 创 














属性 。 但 是 ， 当 我 们 试 





些 方法 函数 ， 以 上 介绍 为 了 解 namedtuple 函数 是 如 何 工作 的 提供 了 一 些 提示 。 


图 往 namedtuple 





属性 时 ， 必 须 非常 小 心 。 属 性 的 列表 和 new__() 的 参数 会 编码 后 存储 在 _fields 中 。 
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BlackjackCard = namedtuple('BlackjackCard', 'rank, suit,hard, soft') 
class AceCard( BlackjackCard ) : 


_slots = () 
def new ( self, rank, suit ): 
return super(). new ( AceCard, 'A', suit, 1, 11 ) 









































我 们 用 slots_ 保 证 子 类 中 没有 _ dict ， 我 们 无 法 添加 任何 新 属性 。 我 们 重 载 了 
_new () ， 这 样 我 们 就 可 以 只 用 两 个 值 (rank 和 suit ) 构造 实例 ， 但 是 重 载 的 _new __() 会 填充 
所 有 的 4 个 值 。 


6.3.2 deque 类 


一 个 1ist 对 象 骨 在 为 容器 内 的 任何 位 置 元 素 的 修改 提供 一 致 的 性 能 。 但 是 ， 有 一 些 操作 会 损失 
性 能 。 最 值得 注意 的 是 ， 任 何在 1ist 头 部 的 操作 (1ist.insert (0，item) 或 者 1ist .pop(0)) 
都 会 损失 一 些 性 能 ， 因 为 列表 的 大 小 改变 了 ， 同 时 所 有 元 素 的 位 置 也 改变 了 。 

deque 一 一 一 个 双向 队列 一 一 旨 在 为 列表 中 的 第 1 个 和 最 后 一 个 元 素 提 供 一 致 的 性 能 。 它 的 追 
加 和 弹出 操作 会 比 内 置 的 1ist 对 象 快 。 


» 不 规则 的 拼写 
Q 类 名 的 首 字 母 通 常 大 写 。 但 是 ，deque 没有 这 样 做 。 






































































































































































































































\ 是 从 尾部 弹出 ， 一 副 牌 的 设计 避免 了 list 对 象 潜在 的 性 能 缺陷 。 

但 是 ， 由 于 我 们 只 使 用 了 1ist 对 象 中 很 少 的 一 部 分 特性 ， 或 许 一 个 像 geque 这 样 的 结构 能 

够 更 好 地 适应 我 们 的 需求 。 我 们 只 是 用 1ist 存储 所 有 的 牌 ， 这 样 就 可 以 实现 洗 牌 和 从 集合 中 弹出 

的 操作 。 除 了 洗 牌 ， 我 们 的 程序 从 未 通过 下 标 访问 元 素 。 
尽管 geque .pop () 方法 可 能 非常 决 ， 但 是 不 是 非常 适合 洗 牌 操作 。 洗 牌 会 随机 地 访问 容器 中 

的 元 素 ，deque 并 不 是 为 这 种 操作 所 设计 的 。 
为 了 找 出 潜在 的 开销 , 我 们 可 以 像 下 面 这 样 , 用 timeit 来 比较 用 1ist 和 deque 洗 牌 的 性 能 。 


>>> timeit.timeit('random.shuffle (x) ',""" 






















































































































































































. import random 
... Xx=list (range (6*52))""") 
597.951664149994 


>>> timeit.timeit('random.shuffle(d)',""" 
. from collections import deque 
. import random 
d=deque (range (6*52))""") 
609.9636979339994 




















我 们 使 用 random. shuffle () 调用 timeit。 一 个 基于 1ist 对 象 ， 另 一 个 基于 deque。 
结果 说 明 qeque 的 洗 牌 操作 仅仅 比 1ist 慢 一 点 一 一 大 约 慢 2%， 这 样 的 差别 可 以 忽略 不 计 。 
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我 们 可 以 很 自信 地 尝试 将 List 换 成 ageque。 
需要 做 的 修改 如 下 。 


from collections import dequeue 
class Deck (dequeue): 
def init ( self, size=l1 ) : 
super(). init  () 
for d in range (size): 
cards = [ card(r,s) for r in range(13) for s in Suits ] 
super() .extend( cards ) 
random.shuffle( self ) 


在 Deck 的 定义 中 ， 我 们 把 1ist 换 成 了 qeque， 其 他 部 分 保持 不 变 。 
现在 性 能 的 差别 有 多 大 呢 ?” 让 我 们 测试 一 下 创建 100000 张 牌 的 性 能 。 


>>> timeit.timeit ('x.pop()', "x=list (range (100000) ) "v 
number=100000) 

0.032304395994287916 

>>> 七 Imeit .timeit ('x.pop()', "from collections import deque; 
x=deque (range (100000))", number=100000) 

0.013504189992090687 



















































































这 里 ， 我 们 用 了 x .pop () 来 调用 timeit。 一 个 基于 1ist， 另 一 个 基于 deque。 

处 理 时 间 几 乎 减少 了 一 半 (准确 地 说 是 和 2%)。 数 据 结构 上 的 一 个 小 改变 为 我 们 节省 了 大 量 的 开销 。 
通常 ， 为 程序 选择 最 优 的 数据 结果 是 非常 重要 的 。 多 尝试 几 种 不 同 的 数据 结构 可 以 告诉 我 们 哪 
一 种 更 高 效 。 


6.3.3 使 用 ChainMap 


将 映射 连接 在 一 起 的 场景 非常 符合 Python 中 关于 本 地 与 全 局 的 概念 。 当 我 们 在 Python 中 使 用 
一 个 变量 时 ， 会 按照 先 本 地 命名 空间 、 后 全 局 命名 空间 的 顺序 搜索 这 个 变量 。 除 了 搜索 这 两 种 命名 
空间 外 ，Python 还 会 在 本 地 命名 空间 中 设置 一 个 变量 ， 但 是 这 个 变量 不 会 影响 到 全 局 命名 空间 。 这 
种 默认 的 行为 (没有 使 用 global 或 者 nonlocal 语句 ) 也 是 chainMap 的 工作 方式 。 
当 我 们 的 程序 开始 运行 时 ， 我 常常 会 从 命令 行 参数 、 配 置 文件 、 操 作 系统 环境 变量 甚至 有 可 能 
是 基于 安装 范围 的 配置 中 获取 属性 。 我 们 希望 可 以 将 这 些 属性 整合 到 一 个 类 似 于 字典 的 结构 中 ， 这 
样 我 们 就 可 以 轻易 地 对 配置 进行 定位 。 

不 使 用 类 似 下 面 这 样 的 程序 启动 代码 ， 它 结合 了 多 个 不 同 来 源 的 配置 选项 。 


import argparse 















































































































































































































































































































































import json 

import os 

parser = argparse.ArgumentParser (description='Process some 
integers.') 

parser.add argument ( "-c", "--configuration", type=open, 
nargs="'?') 


116 第 6 章 创建 容器 和 集合 


parser.add argument ( "-p", "--playerclass", type=str, nargs="'?', 
default="Simple" ) 
cmdline= parser.parse args('-p Aggressive'.split()) 


if cmdline.configuration: 
config file= json.load!( options.configuration ) 
options.configuration.close() 

else 
config file= {} 


with open("defaults.json") as installation: 
defaults= json.load( installation ) 

# Might want to check ~/defaults.json and 
/etc/thisapp/defaults.json, also. 


from collections import ChainMap 





options = ChainMap (vars (cmdline), config file, os.environ, 
defaults) 


上 面 的 代码 向 我 们 展示 不 同 来 源 的 配置 ， 有 如 下 几 种 。 

@ 命令 行 参数 。 我 们 看 到 了 一 个 令 牌 参数 playerclass， 但 是 通常 还 会 有 许多 其 他 
样 的 参数 。 
@ 其 中 一 个 参数 一 一 configuration， 是 带 有 一 些 额 外 参数 的 配置 文件 的 文件 名 。 这 个 参 
数 应 该 用 JSON 表示 并 且 会 读 取 这 个 文件 的 内 容 。 

@ 此外， 还 有 一 个 defaults .json 文件 以 及 另外 一 个 可 以 寻找 配置 值 的 地 方 。 
基于 上 面 的 代码 ， 我 们 可 以 建立 一 个 单一 的 chainMap 对 象 使 用 案例 ， 在 这 个 案例 中 ， 我 们 可 
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以 在 指定 的 位 置 中 查找 参数 。chainMap 实例 会 按 顺 序 在 每 一 个 映射 中 搜索 指定 值 。 这 为 我 们 提供 


了 


一 种 简洁 、 易 于 使 用 的 处 理 运行 时 选项 和 参数 的 方法 。 






























































在 第 13 章 “ 配 置 文件 和 持久 化 ”和 第 16 章 “ 使 用 命令 行 ” 中 ， 我 们 会 再 次 探讨 这 个 主题 。 











6.3.4 ”OrderedDict 集合 


来 


By 





田 ， 


优化 对 象 间 的 这 种 关系 。 我 们 可 以 使 用 orqereqDict 结构 保持 源 文档 























OrderedCollection 集合 很 聪明 地 使 用 了 两 种 存储 结构 。 使 用 一 个 基本 的 qict 对 象 类 型 用 












































匹配 键 和 值 。 另 外 ， 使 用 存储 了 键 的 双向 列表 用 来 维护 插入 顺序 。 












































ordereqDict 的 一 个 常用 场景 是 处 理 HTML 或 者 XML 文件 , 这 些 文件 中 对 象 的 顺序 必须 保 
但 是 对 象 之 间 有 可 能 通过 ID 或 者 IDREF 属性 互相 引用 。 通 过 将 ID 用 作 字 和 典 的 键 ， 我 们 可 以 
对 象 的 顺序 。 

这 里 不 想 将 处 理 XML 作为 探讨 的 主题 ， 这 是 第 9 章 “ 序 列 化 和 保存 一 一 JSON、YAML、Pickle、 


















































































































































CSV 和 XML” 的 主题 。 
































考虑 这 个 简短 的 示例 XML 文档 ， 该 文档 索引 之 间 包 含 非常 复杂 的 引用 。 我 们 假设 这 是 一 个 微型 

















博客 的 源 文件 ， 它 包含 了 具有 ID 属性 的 一 系列 有 序 的 元 素 ， 同 时 也 包含 了 使 用 IDREF 属性 引用 
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原始 元 素 的 索引 。 
我 们 将 这 个 XML 分 为 两 个 部 分 。 


<blog> 
<topics> . </topics> <indices> . </indices> 
</blog> 











topics 和 indices 会 各 有 它们 自己 的 内 容 ， 下 面 是 这 个 博客 中 topics 的 部 分 。 























<topics> 

<entry ID="UUID98766"><title>first</title><body>more 

words</body></entry> 

<entry 
ID="UUID86543"><title>second</title><body>words</body></entry> 

<entry 

ID="UUID64319"><title>third</title><body>text</body></entry> 

</topics> 














每 一 个 topics 都 包含 一 系列 的 entry。 每 一 个 entry 都 有 一 个 唯一 的 ID。 这 里 在 暗示 它 
们 应 该 属于 通用 唯一 标识 符 (Universally Unique ID，UUID) ， 但 我 们 还 没有 给 出 实际 的 例子 。 
下 面 是 博客 中 表示 indices 的 XML 代码 。 


<indices> 
<bytag> 






































<tag text="#sometag"> 
<entry IDREF="UUID98766"/> 
<entry IDREF="UUID86543"/> 
</tag> 
<tag text="#anothertag"> 
<entry IDREF="UUID98766"/> 
<entry IDREF="UUID64319/> 





</tag> 
</bytag> 
</indices> 

















indices 中 的 每 个 元 素 通 过 tag 来 表示 。 可 以 看 到 ， 每 个 七 ad 中 都 包括 了 一 | entry 的 列表 。 
每 一 个 entry 都 包含 了 一 个 指向 原始 博客 对 应 元 素 的 引用 。 
下 面 的 代码 会 解析 源 文件 并 且 生 成 一 个 orderedDict 集合 。 


from collections import OrderedDict 






































import Xml .etree.ElementTr as etree 





doc= etree.XML( source ) # Parse 


topics= OrderedDict() # Gather 
for topic in doc.findall( "topics/entry" ): 
topics[topic.attrib['ID']] = topic 
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for 


print( topic, topics[topic] .find("title") .text 


第 1 部 
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a 





topic in topics: # Display 


，# Parse， 会 解析 XML 源 文 







































































牛 ， 然 后 创建 一 个 
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plementTree 对 象 
































第 上 部 分 6 
第 2 部 分 ，# Gather， 会 过 历 topics 中 所 有 的 entry。topics 中 的 每 一 个 元 素 都 会 根据 
ID 存 入 OrderedDict 集合 中 。 元 素 间 原本 的 顺序 会 被 保留 ， 这 样 就 可 以 按 正确 的 顺序 呈现 出 来 。 
最 后 一 部 分 ，# Display， 会 以 原始 顺序 显示 entry 和 它们 的 ID。 
6.3.5 defaultdict 子 类 
当 一 个 键 不 存在 时 ， 默 认 的 gict 类 型 会 抛 出 一 个 异常 。qefaultqict 集合 类 型 会 执行 一 个 
给 定 的 函数 ， 并 将 执行 结果 作为 这 个 不 存在 的 键 值 存 入 字典 中 。 
-» 注意 不 规则 的 拼写 方式 
Q 类 名 通常 首 字 母 大 写 。 但 是 ，defaultdict 类 没有 遵守 这 个 规则 。 
defaultdict 类 的 一 个 常见 应 用 是 为 对 象 创建 索引 。 当 有 一 些 对 象 共同 包含 一 个 键 时 ,我们 


可 以 创建 一 个 对 象 列表 
下 面 的 代码 向 我 们 展示 了 如 何 将 月 





outcomes 
self.play hand( table, 
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这 个 











共 诗 














oO 





defaultdict (1i 


hand 





st) 
) 


outcome= self.get Payout () 


outcomes [hand.dea 


out com 


况 。 可 以 通过 计算 赢 和 输 的 次 数 或 者 进行 其 他 的 定 





日 
A 











的 值 

















es[rank]! 





























佬 





家 的 牌 面值 作为 结果 























< 人 





些 情况 下 ， 我 们 


可 





用 安 

































































卫 
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分 析 来 入 


想 用 qefaultdict 集合 提供 





本 


ler card.rank] .append (outcome) 


个 模拟 的 收益 列表 , 我 们 可 以 求 这 些 值 的 平均 数 或 总 数 来 统计 收益 情 
够 让 损失 最 小 化 收益 最 大 化 的 策略 。 


Hp 
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心 z 各 已 


人 契 乃 
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比 起 container . 


日 
白 





get (key, "N/A")， 更 倾向 于 使 用 container [key] 。 当 key 不 存在 时 ， 总 是 返回 一 个 字符 上 
和 常量。 实现 这 个 行为 的 难点 在 于 defaultqdict 类 会 使 用 一 个 无 参 的 函数 创建 默认 值 ， 没 有 办 法 为 
其 指定 一 个 常量 。 

我 们 可 以 创建 一 个 无 参 的 lambda 对 象 ， 这 种 方式 非常 符合 我 们 的 需求 ， 下 面 是 一 个 例子 。 

>>> from Collections import defaultdict 

>>> messages = defaultdict( lambda: "N/A" ) 

>>> messages['errorl']= 'Full Error Text" 

>>> messages['other'] 

'N/A' 

当 键 不 存在 时 ， 总 是 返回 一 个 默认 值 ， 将 键 ( 本 例 中 是 'other') 添加 到 字典 中 。 我 们 可 以 
通过 查找 所 有 值 是 "N/A" 的 键 来 确定 添加 了 多 少 新 值 。 

>>> [k for k in messages if messages[k] == "N/A" 


['other'] 






























































6.3.6 counter 集合 
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正如 你 从 上 面 的 输出 中 看 到 的 ， 我 们 找到 了 默认 值 "N/RA" 的 键 。 


defaultdict 类 的 一 个 最 常用 场景 是 为 事件 计数 ， 可 使 用 下 面 这 样 的 代码 来 完成 。 


frequency = defaultdict (int) 
for k in some iterator(): 


frequency[k] += 1 


以 上 代码 计算 了 kk 在 some iterator() 生 成 的 序列 中 出 现 的 次 数 。 
























































合 比 一 个 简单 的 de 





复杂 。 它 可 用 于 确定 最 常用 值 的 场景 ， 也 就 是 统计 学 家 说 的 众 数 (mode) 。 
这 并 不 难 ， 但 是 由 于 这 是 一 种 样板 代码 ， 


























我 们 需要 调整 defaultdict 对 象 中 的 值 来 找到 众 数 。 
因此 会 让 人 感到 厌烦 ， 代 码 看 起 来 像 下 面 这 样 。 


by _ value = defaultdict (1ist) 
for k in frequency: 














by_ valuel[ fredquency [K] ] .append(k) 


我 们 创建 了 另 一 个 字典 。 这 个 by_value 字典 的 键 是 上 面 frequency 字 


























于 这 种 需求 很 常见 ， 因 此 有 一 个 dqefaultdict 的 等 价 对 象 提 供 了 和 上 面 的 代码 一 样 的 
功能 一 一 它 就 是 Counter。 但 是 ， 相 对 来 说，Counter 集 


faultdict 类 更 加 


















































中 的 值 。 每 一 个 键 











都 与 原本 some_iterator () 返 回 的 值 关 联 。 


























接着 ， 我 们 可 以 用 下 面 的 代码 定位 并 按 出 现 频率 排序 并 显示 出 的 最 常用 值 。 


for freq in Sorted (by value, reverse=True): 
print( by value[freq], freq ) 











这 会 创建 一 个 频率 分 布 图 , 它 向 我 们 展示 了 一 个 给 定 频率 的 所 有 值 和 所 有 共享 这 些 键 值 的 频率 计数 。 

































































上 面 的 所 有 属性 都 是 Countez 集合 的 一 部 分 , 下 面 是 一 个 基于 某 些 数据 创建 频率 分 布 图 的 例子 。 




















from Collections import Counter 

frequency = Counter(some iterator()) 

for k,freq in frequency.most common () : 
print( k, freq ) 





这 个 例子 告诉 我 们 ， 通 过 向 counter 提供 可 迭代 的 对 象 ， 我 们 就 可 以 轻易 地 获得 统计 数据 。 














它 会 收集 可 迭代 对 象 中 每 个 值 的 频率 数据 。 本 例 中 ， 我 











们 提供 了 一 个 返回 





some_iterator() 。 我 们 也 可 以 选择 提供 一 个 序列 或 者 其 他 集合 。 


























可 和 迭代 对 象 的 函数 


然后 ， 我 们 可 以 降序 地 显示 结果 。 但 是 ， 等 等 ! 这 并 不 是 Counter 的 全 部 。 


























Counter 集合 并 非 仅仅 是 defaultqict 集合 的 变种 。 这 个 类 名 有 




















Counter 对 象 实 际 是 一 个 “多 重 集 合 ” 有 时 候 也 被 称 为 “ 包 ” 
它 不 是 一 个 用 下 标 或 者 位 置 来 标志 元 素 
的 序列 ， 顺 序 在 包 中 并 不 重要 。 它 也 不 是 一 个 键 值 映射 。 它 像 是 一 个 元 素 就 代 午 











它 是 一 个 类 似 set 的 集合 ， 但 是 在 包 中 是 允许 重复 的 。 
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“误导 的 成 分 。 一 个 



































它们 本 身 并 且 顺 序 
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无 关 的 集合 (set )。 但 是 ， 它 又 不 是 一 个 集合 ， 因 为 ， 正 如 这 个 例子 中 所 看 到 的 ， 元 素 可 以 重复 。 
于 元 素 可 以 重复 ，Counter 对 象 用 一 个 整数 来 统计 多 次 出 现 的 元 素 ， 因 此 它 可 以 被 用 来 创建 

频率 表 。 但 是 ， 它 的 用 处 不 止 如 此 。 由 于 包 类 似 于 一 个 集合 ， 因 此 我 们 可 以 通过 比较 两 个 包 中 的 元 
素来 创建 并 集 或 者 交集 。 

让 我 们 创建 两 个 包 。 

>>> bagl= Counter ("aardwolves") 

>>> bag2= Counter ("zymologies") 

>>> bagl 

Counter(t a a 2 Os Lr TE! 1, 'w' J 7 1, 'e"' i 

| 

>>> bag2 

Gounter({ os 2 nv 1 1 下 于 和 ee 上 

eS. Ly (S21) 

我 们 通过 扫描 一 个 字母 序列 来 创建 包 。 对 于 每 一 个 出 现 超 过 一 次 的 字母 , 会 有 对 应 一 个 大 于 
的 计数 。 

我 们 可 以 很 容易 地 得 到 两 个 包 的 并 集 。 

>>> bagl+bag2 

COUNter (TO Br VS 2 TL ev 2 Da 2 TEE yp VY ny 

vi i Nl EEN ly: TMT, Si My SO dy A Ly 

这 个 结果 显示 了 两 个 字符 串 中 所 有 的 字符 。 有 3 个 o。 毫 不 意外 地 ， 其 他 的 字母 不 是 很 流行 。 

我 们 也 能 同样 容易 地 得 到 两 个 包 的 不 同 元 素 。 

>>> bagl-bag2 

COUurniter(t a "We by TV VE 

>>> bag2-bagl 

Counter({ olen ly Mee ly Bl Ye Li Er "LUST ) 



































第 1 个 表达 式 显示 的 是 pag1l 





有 而 bag2 中 没有 的 元 素 。 

















第 2 个 表达 式 显 示 的 是 bag2 中 有 而 bagl 中 没有 的 元 素 。 注 意 ，o 在 bag2 : 












































也 出 现 了 一 次 。 结 果 只 是 从 bagl 中 移 除 了 


在 bagl 上 














6.4 创建 新 集合 























出 现 了 两 次 3 
































的 一 个 o。 











现在 来 看 看 Python 内 置 容器 类 型 支持 哪些 扩展 。 当 然 ， 我 们 不 会 举例 说 明 如 何 扩展 每 个 容器 。 























如 果 这 么 做 ， 那 么 这 本 书 的 体积 就 会 变 得 超出 我 们 的 控制 了 。 
我 们 会 以 一 个 容器 为 例 来 看 看 扩展 容器 的 过 程 是 怎样 的 。 









































通常 从 这 里 开始 看 : http://en.wikipedia. 






























































1. 定义 需求 。 这 可 能 包括 研究 维基 百科 (Wikipedia)， 
org/wiki/Data_structure。 由 于 我 们 需要 考虑 到 边界 情况 ， 
2. 如果 需要 ， 看 一 下 必须 实现 











忆 此 数据 结构 的 设计 可 能 会 非常 复杂 。 














collections .abc 模块 中 的 哪些 方法 才能 新 增 我 们 需要 的 功能 。 





3. 创建 一 些 测试 

















6.5 定义 一 种 新 的 序列 


























j 例 。 这 也 需要 仔细 下 




















4. 代码 。 
我 们 需要 特别 强调 ， 在 尝试 发 明 新 的 数据 结构 前 ,认真 研习 基 而 
上 寻找 概述 和 总 结 ， 对 于 具体 内 容 的 学 习 也 是 非常 


和 Stein 所 著 的 Introduction to Algorithms,，Aho、U 





















































究 算 法 ， 才 能 确定 我 们 可 以 I 








Algorithms 或 者 Steven Skiena 所 著 的 The Algorithm Design Manual。 




















正如 我 们 前 
新 集合 的 方法 。 
扩展 : 
封装 
新 建 : 


























对 这 个 主题 进行 





















































因此 我 们 只 会 简 地 介 


耐看 至 的 ， 提 





























操作 现 有 的 序列 。 








: 操作 现 有 的 





序列 。 








里 论 上 ， 我 们 可 以 给 出 多 达 9 个 示例 


介绍 ， 











创建 一 个 新 序列 。 





象 基 类 定义 了 三 大 类 集合 : 序列 、 












































站 绍 如 何 创建 新 映射 。 我 们 也 会 探究 如 何 


6.5 定义 一 种 新 的 序列 


























打牌 的 速率 从 每 小 时 50 手 到 200 手 不 等 。 我 

















可 以 ) 





def mean ( 


当 我 们 进行 统计 分 析 时 ， 常 常会 
器 会 产生 一 些 结果 ， 我 们 必须 对 这 些 结果 进行 统计 分 析 才能 知道 

当 我 们 模拟 一 个 打牌 的 策 
它们 向 我 们 展示 了 用 某 和 


























会 探究 一 下 如 何 创 建新 的 序列 、 
经 有 很 多 扩展 的 映射 (例如 chainMap、Ordered 

















需要 基于 一 些 数据 计算 平均 数 、 众 数 和 标 ; 








略 时 , 我 们 应 该 以 一 些 结果 数据 作为 结束 ， 


映射 和 集合 。 























特定 策略 打牌 的 结果 。 











对 于 一 张 # 


























Outcomes ) : 
































有 以 下 3 种 可 自 























休息 。 











一 个 内 置 的 1ist 类 累加 结果 。 我 们 可 以 通过 4 来 计算 平 共 











return sum(outcomes)/len (outcomes) 


标准 





差 可 以 通 

















HO 





def stdev( 


outcomes ) : 


n= len (outcomes) 


return math.sqrt( n*sum(x**2 for x in outcomes) 


这 些 都 是 相对 比较 简单 的 计算 函数 。 但 是 ， 




















那么 有 用 了 。 
我 们 不 会 在 第 























1 个 例子 中 重 












































—sum(outcomes)**2 )/n 
随 着 问题 变 得 更 复杂 ， 这 种 没有 
四 向 对 象 编程 的 一 个 优点 就 是 可 以 将 功能 与 数据 整合 在 一 起 。 

写 任 何 1ist 的 特殊 方法 ， 只 会 继承 1ist， 然 后 增加 一 些 用 于 统 
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E 确 地 处 理 边界 情况 。 


上 知识 是 非常 重要 的 。 除 了 在 网 
\ 要 的 。 可 以 阅读 Cormen、Leiserson、Rivest 
llman 和 Hopcroft 所 著 的 Data Structures and 


定义 


用 每 种 不 同 的 方法 分 别 自 定义 每 个 集合 。 之 后 会 
如 何 扩展 和 封装 现 有 的 序列 。 
Dict、 defaultdict 玫 


创建 一 个 新 的 有 序 包 (或 者 称 为 多 重 集 合 )。 





1H Counter), 


舍 差 。 我 们 的 21 点 模拟 
我 们 是 否 真 的 创建 了 一 种 更 好 的 策 
这 些 数 据 是 一 
挤 的 桌子 和 一 张 只 
门 会 假设 玩 200 手 的 21 点 就 需要 


略 。 


系列 的 数字 ， 
有 一 个 玩家 的 桌子 ， 


朋 织 的 函数 就 不 是 
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计 和 


的 方法 。 这 是 一 种 非常 常见 的 扩展 方式 。 

















我 们 会 在 第 2 个 例子 中 再 



































改进 这 个 类 ， 这 检 


fF 我 们 就 能 修改 和 扩展 特殊 方法 。 这 需要 仔细 研究 提 



































象 基 类 的 特殊 方法 ， 这 样 才 知 
忆 为 我 们 正在 探讨 序列 























道 需要 增加 和 修改 


， 所 以 必须 使 用 


会 已 末 


Hel 























那些 方法 才能 正确 地 继承 内 置 1ist 类 的 所 有 特性 。 
Python 的 slice 记号 。 我 们 会 看 看 slice 是 什么 以 




















及 它 是 如 何 与 _getitem 、 


”setitem 和 delitem 一 起 工作 的 。 


第 2 个 重要 的 设计 原则 是 封装 。 我 们 会 创建 一 个 1ist 的 封装 类 ， 
这 个 类 , 当 涉 及 对 象 持久 化 时 , 封装 具有 一 定 的 优势 , 这 是 
Pickle、CSV 和 XML” 的 内 容 。 

我 们 也 会 介绍 自 定义 一 种 新 的 序列 需要 做 什么 。 


6.5.1 一 个 用 于 统计 的 list 
将 计算 平均 值 和 标准 差 的 有 
音 扩展 子 类 。 


class Statslist(] 
@property 








AAA 
fe = 
2 











会 介 























性 

















List) : 


def mean (self): 

return suml(self)/len(self) 
@property 
def stdev (self): 

n= len (self) 


return math.sqrt ( n*sum(x**2 for x in self)-~sum(self)**2 








然后 介绍 如 何 将 方法 委托 给 








)/n 


利用 这 个 对 内 置 1ist 类 的 简单 扩展 ， 我 们 可 以 更 容易 地 收集 数据 和 报表 统计 。 




















可 以 设想 有 一 个 全 局 可 以 使 ) 


for s in SomePl 








的 模拟 脚本 ， 如 下 所 示 。 


ayStrategy, SomeOtherStrategy : 
) 














sim = Simulator( s, SimpleBet () 
hands=200 ) 


name , data.mean, 


6.5.2 主动 计算 和 延迟 计算 


data = sim.runl( 


print( s. class data.stdev ) 





9 章 “ 序 列 化 和 保存 一 一 JSON、YAML.、 


直接 集成 在 1ist 的 子 类 中 是 一 种 非常 明智 的 做 法 。 我 们 可 以 这 











注意 ， 我 们 的 计算 都 是 延迟 的 。 只 有 在 被 请 求 的 时 候 ， 它 们 才 会 执行 。 这 也 意味 着 每 次 被 请 求 






















































































时 ， 它 们 都 会 执行 。 根 据 这 些 类 的 对 象 所 处 的 不 同上 下 文 ， 这 可 能 是 一 个 相当 大 的 开销 。 

实际 上 , 将 这 些 统计 汇总 的 计算 转换 为 主动 计算 是 很 明智 的 做 法 , 正如 我 们 所 知道 的 , 从 1ist 
添加 或 者 删除 元 素 就 是 主动 的 。 尽 管 创建 这 些 函 数 的 主动 计算 版 本 增加 了 一 些 编码 量 ， 但 是 当 数 据 
规模 很 大 时 ， 它 能 显著 地 提高 性 能 。 

主动 计算 的 关键 是 防止 用 循环 求 和 。 如 果 我 们 主动 地 做 求 和 操作 ， 由 于 1ist 已 经 创建 了 ， 因 





此 我 们 就 不 用 再 循环 遍历 数据 。 


























如 果 我 们 查看 Sequence 类 的 所 有 特殊 方法 , 就 可 以 看 到 已 经 包含 了 用 于 添加 、 删 除 和 修改 
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这 个 序列 的 方法 。 我们 可 以 利用 这 些 方法 计算 出 我 们 需要 的 两 种 不 同 总 和 。 我们 从 Python 标准 库 
文档 中 的 8.4.1 节 一 一 collections.abc 开始 ， 这 个 部 分 的 地 址 是 http://docs.python. 


org/3.4/library/collections.abc.html#collections-abstract-base-classes。 














站 面 是 实现 MutableSequence 类 必须 实现 的 方法 : _ getitem 、_setitem 、 
_gdelitem 、 len 、insert、 append、 reverse, extend、 pop、 remove 和 iadqd 。 
文档 中 也 描述 了 从 sequence 中 继承 而 来 的 方法 。 但 是 ， 由 于 那些 方法 都 是 为 不 可 变 序列 设计 的 ， 
因此 可 以 暂时 忽略 它们 。 

下 面 列 出 了 每 个 方法 中 必须 实现 的 逻辑 。 
为 不 涉及 状态 的 改变 。 
@ setitem : 这 个 方法 改变 了 一 个 元 素 的 状态 。 我 们 需要 从 每 个 总 和 中 减 去 原本 元 素 的 
值 ， 然 后 再 将 新 元 素 的 值 累加 进 总 和 中 。 
__delitem : 这 个 方法 会 删除 一 个 元 素 。 我 们 需要 从 总 和 中 移 除 被 删除 元 素 的 值 。 
_len : 无 ， 因 为 也 不 涉及 状态 的 改变 。 
insert: 由 于 这 个 方法 插入 一 个 新 元 素 ， 因 此 我 们 需要 将 这 个 元 素 累 加 进 总 和 中 。 
append: 这 个 方法 也 会 添加 一 个 新 元 素 ， 所 以 我 们 同样 需要 将 这 个 元 素 累 加 进 总 和 中 。 
reverse: 无 ， 因 为 不 会 影响 平均 值 和 标准 差 的 计算 。 
extend: 这 个 方法 会 添加 许多 元 素 ， 例 如 _init ， 所 以 在 扩展 1ist 之 前 ， 我 们 需要 
处 理 每 个 新 加 入 的 元 素 。 
@ pop: 这 个 方法 会 删除 一 个 元 素 。 我 们 需要 从 总 和 中 移 除 对 应 元 素 。 
@ remove: 这 个 方法 也 会 删除 一 个 元 素 。 我 们 同样 需要 从 总 和 中 移 除 对 应 元 素 。 
@ _iadd : 这 个 方法 实现 了 += 增 量 赋值 语句 ， 它 和 extend 关键 字 完全 相同 。 
我 们 不 会 详细 讲解 每 个 方法 ， 因 为 实际 上 只 有 以 下 两 种 情况 。 
@ 添加 一 个 新 值 。 
@ 删除 一 个 旧 值 。 
蔡 换 的 情况 只 是 综合 使 用 了 添加 和 删除 操作 。 
下 面 是 一 个 主动 的 StatsList 类 的 例子 。 我 们 只 会 展示 insert 和 pop 方法。 
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@ _getitem : 无 ， 































































































































































































































































































class StatsList2 (1List) : 
mW "Eager EE 





def _init ( self, *args, **kw ): 
self.sum0 = 0 # len(self) 
self.suml 0 # sum(self) 
self.sum2 = 0 # sum(x**2 for x in self) 


super(). init ( *args, **kw ) 
EO i SELE: 
self. new (x) 
def new( self, value ) : 
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这 两 个 方法 




















2 st 
xeL x 





我 们 还 有 
， 我 们 
我 们 可 以 通过 一 











段落 





(8， 


def 


Selt 
Se 
Sel 


f.sum0 += 1 


f.suml += Value 


f.sum2 += value*value 


_rmv( self, value 


Sel 
Sel 
sel 


小 这 


f.sum0 -= 1 
f.suml -= value 
f.sum2 -= value*value 


insert( self, inde 


super () 
sel 


f. new(value) 


def pop( self, index=0 





Val 
Se 


return value 


我 们 创建 了 3 个 内 部 变量 








(通过 初始 化 或 者 用 insert ( 
用 上 面 这 两 个 方法 保 订 








》 


f. rmv(value) 




















x, Value ) : 


.Insert ( index, value ) 


3 


Lue= super() .pop( index ) 








EE， 变 量 后 的 注释 是 这 个 类 维护 它们 的 方法 。 我们 称 这 些 变 量 为 “和 常 
量 ”(sum invariants )， 因 为 每 个 变量 都 包含 了 一 种 特定 的 和 ， 并 且 这 些 和 在 类 的 状态 被 改变 时 仍然 
与 类 保持 恒定 的 关系 。 这 种 主动 计算 的 机 制 主要 依赖 于 rmv () 和 _new(0 方 法 ， 当 1ist 被 改变 时 ， 
会 更 新 3 个 “和 常量 ”， 这样 他 们 和 类 的 关系 仍然 保持 不 变 。 

当 我 们 用 pop () 操作 成 功 删 除 一 个 元 素 后 ， 必 须 更 新 这 些 “ 和 常量”。 当 我 们 添加 了 一 个 元 素 
) 方法)， 同 样 也 必须 更 新 我 们 的 “和 常量 ”。 其 他 需要 实现 的 方法 会 
E 我 们 的 3 个 “和 常量 ”与 类 的 关系 保持 恒定 。 我 们 保证 站 .sum0 总 是 
= sl =len(L), suml 总 是 》 ,ix ， SUm2 CR a 


其 他 的 方法 
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例如 append()、extend() 和 remove()， 和 上 面 列举 的 方法 很 类 似 。 我 们 没 





有 在 示例 中 实现 它们 是 因为 和 上 面 8 























于 之 





40， 


个 很 











的 儿 个 方法 实 i 











= StatsList2( [2, 


S 
总 于 分 二 SS 已 和 0 "SL2% Sum SL 
49， 325) 
sl12[2]= 4 
sl2.sum0, sl2.suml, sl 
5 332) 
sl12[-1] 
SUMmO SL2% Suml .BL 











232) 


.insert( 0, -1 ) 
.Pop () 


232) 





EE 要 的 操作 没有 实现 : 通过 1ist [index]=value 蔡 换 特定 元 素 。 在 后 本 
会 深入 讨论 这 个 操作 。 
些 数据 来 看 看 现在 这 个 1ist 是 如 何 工 作 的 。 





的 






































4 Bp dy Dp Dy Ws 97 LO] 
2.sum2 


2.sum2 


2.sum2 


.Sum0, sl2.suml, sl12.sum2 





我 们 可 以 创建 一 个 列表 ， 初 始 化 时 会 相应 地 计算 3 个 “和 常量 ”。 后 续 的 每 次 改变 都 会 主动 地 更 新 对 
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应 的 “和 常量 ”。 我 们 可 以 修改 、 删 除 、 插 入 或 者 弹出 一 个 元 素 ， 每 次 改变 都 会 带 来 一 组 新 的 “和 常量 ”。 
剩 下 的 就 是 将 我 们 的 计算 平均 数 和 标准 差 的 逻辑 加 入 代码 中 了 ， 可 以 像 下 面 这 样 。 


@property 






































def mean (self): 
return self.suml/self.sum0 
@property 
def stdev(self): 
return math.sqrt( self.sum0*self.sum2-self.suml*self.suml )/self.sum0 






























































这 个 函数 重用 了 已 经 算 好 的 “和 常量 ”。 不 再 需要 额外 的 循环 来 计算 这 两 个 统计 项 目 。 
6.5.3 使 用 _getitem_(0、__setitem_ (0、__delitem_ 0 和 slice 操作 
StatsList2 的 例子 中 没有 实现 _setitem () 和 delitem ()，, 因为 它们 和 slice 操作 











E 确 地 实现 这 两 个 方法 。 


Hy 
en 
CC 
EE 


有 关 。 我 们 需要 先 了 解 slice 操作 的 实现 ， 然 后 
序列 包括 了 两 种 不 同类 型 的 索引 。 
@ a[i]: 这 是 一 个 简单 的 整数 索引 。 
@ a[i:j] 或 者 a[i:j:k]: 这 些 使 用 了 start:stop:step 值 的 sLice 
达 式 有 7 种 不 同 的 重 载 。 
基本 的 语法 主要 基于 3 个 上 下 文 。 
@ ， 依 赖 于 _getitem () 获取 一 个 值 。 
@ ”作为 赋值 语句 的 左 操 作 数 时 ， 依 赖 于 _setitem _() 设 定 一 个 值 。 
@ 在 del 语句 中 时 ， 依 赖 于 _qelitem_ _() 删除 一 个 值 。 
当 我 们 做 一 些 类 似 于 seq[ :-1] 的 操作 时 , 我 们 就 是 在 写 sLice 表达 式 。 底 层 的 _getitem () 
方法 会 接受 一 个 slice 对 象 作为 参数 ， 而 不 是 一 个 简单 的 整数 。 
参考 手册 告诉 了 我 们 一 些 关 于 slice 的 信息 。 一 个 slice 对 象 包含 3 个 属性 : start、stop 
和 step。 同 时 ， 它 也 有 一 个 叫 作 indices () 的 函数 ， 当 上 述 任何 属性 缺失 时 ， 这 个 函数 会 正确 地 
计算 出 缺失 属性 的 值 。 
我 们 用 一 个 扩展 了 1ist 的 简单 类 来 探索 slice 对 象 。 


class Explore (list): 
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7 下 


RR 达 式 。slice 
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def getitem ( self, index ) : 
print( index, index.indices(len(self)) ) 
return super(). getitem ( index ) 


这 个 类 会 打印 slice 对 象 和 indices () 函数 的 返回 值 。 然 后 ， 使 用 了 基 类 中 的 实现 ， 这 样 就 
可 以 让 这 个 类 的 行为 和 普通 的 1ist 一 致 。 
有 了 这 个 类 ， 我 们 可 以 尝试 不 同 的 slice 表达 式 ， 看 看 会 得 到 什么 。 


>>> x= Explore('abcdefg') 












































用 | 
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slice(None, None, None) (0, 7, 1) 
Ta ‘bry ey dy "ely TEVF Vo] 
>>> x[:-1] 

slice(None, -1, None) (0, 6, 1) 
av hbYy vey dy ey, Tf 

小 这 | 让 你 

slice(l1l, None, None) (1, 7, 1) 
的 

> [2 








slice(None, None, 2) (0, 7, 2) 





Lt VE Re 'g'] 


在 上 面 的 slice 表达 式 中 , 我 们 可 以 看 到 一 个 slice 对 象 有 3 个 属性 ， 并 且 这 3 个 属性 的 值 













































































直接 由 Python 语法 提供 。 当 我 们 为 ijngices () 函数 提供 了 一 个 正确 的 长 度 值 时 ， 它 就 会 返回 一 个 














带 有 start、stop 和 step 值 的 元 组 。 


6.5.4 实现 _getitem ()、_ setitem (0 和 delitem (0) 


数 : 





当 我 们 实现 _getitem ()、 setitem () 和 gdelitem () 方 法 时 ， 需 要 接受 两 种 参 


int 和 slice。 

































































当 我 们 重 载 不 同 的 序列 方法 时 ， 必 须 正确 地 处 理 不 同 的 slice 情形 。 
下 面 是 一 个 以 slice 为 参数 的 _setitem _ () 方法 的 实现 。 
def setitem ( self, index, value ) : 
if isinstance (index, slice): 
start, stop, step = index.indices (len(self)) 
olds = [ self[i] for i in range(start,stop,step) ] 
super(). setitem ( index, value ) 


for x in olds: 
self. rmv (x) 
for x in value: 
self. new (x) 
else: 
old= self[index] 
super(). setitem ( index, value ) 
self. rmv(old) 
self. new( 


上 面 的 方法 有 两 个 处 理 路 径 。 

@ 如 果 indqex 是 slice 对 象 ， 我们 会 计算 start、stop 和 step 的 值 。 然 后 ， 定 位 需要 
删除 的 旧 值 。 接 着 ， 会 调用 基 类 中 的 操作 并 用 新 的 值 奉 代 旧 的 值 。 

@ 如果 index 是 一 个 简单 的 int 对象， 那么 旧 的 值 和 新 的 值 都 只 是 一 个 单一 元 素 。 

下 面 是 一 个 以 slice 作为 参数 的 _delitem () 方 法 的 实现 。 


def qdelitem ( self, index ) : 
# Index may be a single integer, or a slice 


value) 
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if isinstance (indqex， slice): 


start, stop, step = indqex.inqices (len(self)) 
olds = [ selfl[i] for i in range(start,stop,step) ] 
super(). delitem ( index ) 


for x in olds: 
self. rmv (x) 
else: 
old= self[index] 
super(). delitem ( index ) 
self. rmv (old) 


同样 地 ， 上 面 的 代码 用 slice 来 确定 哪些 值 应 该 被 删除 。 如 果 index 是 一 个 简单 的 整数 ， 那 么 
只 有 一 个 值 会 被 删除 。 
我 们 引入 合理 的 slice 操作 到 statsList2 类 中 时 , 就 可 以 创建 一 个 拥有 所 有 List 基 类 功能 
的 列表 ， 并 且 这 个 列表 能 够 快速 地 返回 当前 列表 中 元 素 的 平均 数 和 标准 差 。 
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。”， 注意 , 这 些 方法 函数 会 各 自 创 建 一 个 临时 的 1ist 对 象 olds, 这 会 
\ 铭 人、 带 来 一 些 可 以 优化 的 开销 。 作 为 读者 的 一 个 练习 ， 在 这 些 方法 中 
使 用 _rmv () 函数 有 助 于 避免 使 用 olds 变量 。 





6.5.5 ”封装 list 和 委托 


我 们 会 看 看 要 如 何 封装 Python 的 一 个 内 置 容 器 类 。 封 装 一 个 内 置 的 类 意味 着 必须 将 一 些 方法 委 
托 给 底层 的 容器 。 
于 每 个 内 置 的 集合 都 包含 了 大 量 的 方法 ， 封 装 一 个 集合 有 可 能 需要 大 量 的 代码 。 当 需要 创建 
持久 化 类 时 ， 封 装 比 扩展 更 有 优势 。 这 是 第 9 章 “ 序 列 化 和 保存 一 一 JSON、YAML、Pickle、CSV 和 
XML ”的 主题 。 在 某 些 情况 下 ， 我 们 需要 将 内 部 的 集合 暴露 给 大 量 的 序列 方法 使 用 ， 因 为 这 些 方法 
需要 将 实现 委托 给 一 个 内 部 的 列表 。 
前 面 的 统计 数据 类 的 一 个 限制 是 ， 它 们 都 要 求 “ 只 能 插入 ”。 接 下 来 ， 我 们 会 禁用 一 些 方法 。 
而 封装 正 是 为 处 理 这 种 戏剧 性 的 改变 存在 的 。 
网 如 ， 我 们 可 以 设计 一 个 只 支持 append 和 ”getitem 的 类 ， 它 会 封装 一 个 List 类 。 下 
面 的 代码 可 以 用 来 累加 模拟 器 中 生成 的 数据 。 

class StatsList3: 


def init ( self ): 
self. list= list() 





























































































































































































































self.sum0 = 0 # lenl(self), sometimes called "N" 
self.suml = 0 # sum(self) 
self.sum2 = 0 # sum(x**2 for x in self) 


def append( self, value ) : 
self. list.append(value) 





self.sum0 += 1 
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self.suml += Value 
self.sum2 += value*value 
def getitem ( self, index ): 
return self. list. getitem ( index ) 
@property 
def mean (self): 
return self.suml/self.sumO0 
@property 
def stdev (self): 
return math.sqrt( self.sum0*self.sum2-self.suml*self.suml 
) /self.sum0 
这 个 类 中 的 1ist 对 象 是 Python 内 置 的 List 类 。 这 个 列表 总 是 初始 化 为 空 列表 。 由 于 append () 
是 唯一 的 更 新 列表 的 方式 , 我 们 可 以 很 容易 地 维护 不 同 种 类 的 和 。 然 而 我 们 必须 很 小 心地 确保 将 相应 
的 工作 委托 给 基 类 完成 ， 这 样 才能 保证 在 我 们 的 子 类 开始 处 理 参 数 时 当前 列表 中 的 值 是 最 新 的 。 
可 以 直接 将 _getitem () 委托 给 内 部 的 _1ist 对 象 ， 而 不 用 去 关心 参数 和 结果 。 





























可 以 像 下 面 这 样 使 用 这 个 类 。 


>>> S13= StatsList3() 
Srfor data dn2, dy 4 ™ 4, Dy 57 Tr 9s 
sl3.append (data) 











>>> sl3.mean 
5.0 

>>> sl3.stdev 
2.0 


我 们 创建 了 一 个 空 列表 ， 然 后 将 元 素 添加 到 列表 中 。 由 于 每 次 有 元 素 添加 到 列表 中 时 ， 都 会 更 

































































新 “和 常量” 因此 可 以 快速 地 算出 平均 值 和 标准 差 。 

















我 们 并 没有 可 以 让 类 变 成 可 迭代 的 ， 没 有 定义 _iter_ _()。 
于 _getitem () 的 定义 ， 现 在 有 一 些 功能 可 以 工作 了 。 我 们 不 止 能 够 获取 元 素 ， 同 时 也 












































能 看 到 有 一 个 可 以 遍历 所 有 值 的 默认 实现 。 
































这 里 是 一 个 示例 。 


>>> sl13[0] 
2 
>>> for x in S13: 


print (x) 


OF 人 ND: 
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上 面 的 结果 向 我 们 展示 了 即使 是 一 个 最 小 程序 的 封装 的 集合 通常 也 足以 满足 许多 需求 。 


注意 ， 例 如 ， 我 们 并 没有 让 这 个 列表 可 以 计算 自身 的 长 度 。 我 们 试图 



































E32 


下 面 这 样 抛 出 一 个 异常 。 
>>> len(s13) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: object of type 'StatsLis 
我 们 可 能 想 添 加 一 个 


”hash 设 为 None， 但 是 需要 很 小 心 ， 


我 们 可 能 想 定 义 _contains () 并 


就 可 以 创建 一 个 极 简单 的 容器 ， 但 是 它 仍然 提供 了 一 个 容器 所 应 











对 为 这 是 一 个 可 

























































































has no len() 


变 对 象 。 





6.5.6 用 _iter _0 创 建 迭代 器 


~ 


我 





abc.Iterable 的 文档 后 ， 就 会 知道 我 们 
选择 让 ” iter () 方 法 返回 


对 于 一 个 封装 的 集合 ， 应 该 总 是 简单 地 把 








们 的 设计 涉及 封装 一 个 





























只 需要 


也 将 真正 的 工作 委托 给 












































对 于 statsList3 类 ， 它 看 起 来 会 像 下 面 这 样 。 


def iter (self): 


return iter(self. list) 


获取 列表 的 大 小 ， 








这 个 方法 函数 会 将 欠 代 操作 委托 给 内 部 的 _1ist 对 象 的 Iterator。 
6.6 创建 一 种 新 的 映射 


Python 中 内 置 了 aict 映射 ， 在 库 中 也 有 许多 映射 类 型 。 除 了 collections 模块 对 aict 的 扩 





shelve 模块 是 























展 (defaultdict、Counter 和 ChainMap) 之 外 ， 库 : 




















cp 























绍 它 。dbm 模块 与 shelve 类 似 ， 也 是 将 一 个 键 映 射 到 一 个 值 上 。 








mailbox 和 email.message 模块 ! 





大 与 




















被 用 








管理 本 地 邮件 。 








随 着 我 
可 以 升 








的 类 为 邮箱 





门 介绍 越 来 越 多 的 设计 原则 ， 











很 容易 地 算出 中 位 数 和 众 数 。 


级 Counter 类 ， 将 平均 数 和 标准 差 用 











可 以 ) 























有 提供 了 一 个 类 似 于 aict 的 接 





些 模块 包含 了 类 似 于 映射 的 结 
他 映射 的 一 个 重要 示例 。 我 们 会 在 第 10 章 “用 Shelve 保存 和 获取 对 象 ”: 


它 会 像 


len () 方 法 并 将 它 委 托 给 内 部 的 _list 对 象 。 可 能 也 会 想 将 


内 部 的 _list 对 象 。 这 样 一 来 ， 
具有 的 底层 特性 。 





现 有 类 时 ， 需 要 确保 类 是 可 迭代 的 。 当 查看 collections . 
实现 _iter _() 就 可 以 让 一 个 对 象 可 迭代 。 可 以 
个 正确 的 Iterator 对 象 ， 或 者 将 它 写成 一 个 生成 器 函数 。 

尽管 创建 一 个 Iterator 对 象 不 是 非常 复杂 ， 但 是 通常 不 需要 这 么 做 。 创 建委 
iter () 方 法 的 行为 委托 给 内 部 的 集 








成 器 函数 简单 得 多 。 





构 。 


























， 这 个 接口 

















扩展 或 者 封装 的 方式 向 映射 ， 
作 频 率 分 布 数据 存储 。 实 





际 





上 ， 也 能 从 这 个 类 


添加 更 多 功能 。 

















下 面 的 StatsCounter 是 对 Counter 的 一 个 扩展 ， 它 加 入 了 一 些 用 于 统计 的 函数 。 
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from Collections import Counter 
class StatsCounter (Counter): 
@property 
def mean( self ) : 
sum0= sum( Vv for kV in self.items() ) 
suml= sum( k*v for k,v in self.items() ) 
return suml/sum0 
@property 
def stdev( self ): 
sum0= sum( Vv for k,v in self.items() ) 
suml= sum( k*v for k,v in self.items() ) 
Sum2= sum( k*k*v for k,v in self.items() ) 
return math.sqrt( sum0*sum2-suml*suml )/sum0 


我 们 向 Counter 类 中 添加 了 两 个 根据 频率 分 布 计算 平均 数 和 标准 差 的 方法 。 这 里 的 公式 和 前 面 基 





















































于 1ist 对 象 的 主动 计算 中 用 的 类 似 ， 尽 管 这 里 是 基于 Counter 对 象 的 延迟 计算 。 























我 们 用 sum0= sum( v for k,v in self.items() ) 来 计算 值 v 的 和 ， 并 忽略 了 键 k。 


























我 们 可 以 用 一 个 下 划 线 (_) 代替 k 来 强调 我 们 要 忽略 键 。 可 以 用 sum ( v for v in self.values () ) 
来 强调 我 们 不 准备 使 用 键 。 但 是 我 们 更 倾向 于 对 sum0 和 suml 使 用 平行 的 结构 。 


对 象 收集 结果 。 




































































我 们 可 以 用 这 个 类 高 效 地 对 原始 数据 进行 统计 和 定量 分 析 ， 运 行 大 量 的 模拟 ， 然 后 用 Counter 







































































这 里 是 与 列表 中 代表 真实 结果 的 样本 数据 的 交互 。 


>>> sc = StatsCounter( [2, 4, 4, 4, 5, 5, 7, 9] ) 
>>> sc.mean 

Sa0 

>>> sc.stdev 

2.0 

>>> sc.most common (1) 

[(4, 3)] 

>>> list(sorted(sc.elements())) 

[2 4 deb D3 Dy 9] 


most_common () 的 结果 是 一 个 包含 两 个 元 素 的 元 组 ， 其 中 一 个 是 众 数 “4)， 男 一 个 是 这 个 值 











出 现 的 次 数 (3)。 我 们 可 能 想 获取 前 3 个 众 数 ， 这 样 结果 中 就 会 包括 另外 两 个 出 现 频 率 没 有 这 么 高 




















的 元 素 。 通 过 执行 类 似 sc .most_common (3) ， 就 能 获得 出 现 频率 最 高 的 几 个 值 。 





























elements () 方法 按 原 始 数据 中 所 有 元 素 的 顺序 重建 列表 。 
从 排 好 序 的 元 素 中 ， 我 们 可 以 获 


@property 



































旦 


导 中 位 数 ， 就 是 位 于 最 中 间 的 元 素 。 




















-~ 








def median( self ) : 
all= list(sorted(sc.elements ())) 
return alll[llen(all)//2] 


这 个 方法 不 仅 会 是 延迟 执行 ， 而 且 它 会 消耗 很 多 内 存 ; 它 仅仅 为 了 找到 中 位 数 就 用 所 有 的 值 创 























建 了 一 个 完整 的 序列 。 
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尽管 它 很 简单 ， 但 是 这 是 一 种 昂贵 的 使 用 Python 的 方式 。 

一 种 更 明智 的 做 法 是 用 sum (self .values () ) //2 计算 有 效 长 度 和 中 点 。 一 旦 我 们 知道 了 这 
两 个 信息 ， 就 可 以 按 顺 序 访 问 键 ， 并 计算 出 一 个 给 定 键 位 于 哪个 区 域 。 最 后 ， 会 在 包括 了 中 间 点 的 
区 域 中 找到 这 个 键 。 


代码 类 似 于 下 面 这 样 。 





























































































































@property 
def median( self ) : 
mid = sum(self.values())//2 
low= 0 
for k,v in sortedl(self.items()): 
if low <= mid < lowtv: return k 
low += 了 









































我 们 通过 键 和 它们 出 现 的 次 数 定位 最 中 间 的 键 。 注意 ,这 里 使 用 了 内 置 的 sorted 函数 ， 所 以 
还 需要 加 上 它 带 来 的 开销 。 


通过 timeit， 我 们 可 以 知道 前 面 那个 挥霍 内 存 的 版 本 需要 9.5 秒 ， 这 个 更 明智 的 版 本 只 需要 5.2 有 
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创建 一 个 全 新 的 集合 需要 一 些 准备 工作 。 需 要 有 新 的 算法 或 者 新 的 内 部 数据 结构 ， 它 们 能 够 为 
内 置 的 集合 带 来 重大 的 改进 。 在 设计 新 的 集合 之 前 ， 用 “Big-O” 计 算 复 杂 度 是 非常 重要 的 。 在 实 
现 了 新 的 集合 之 后 ， 用 timeit 确保 新 的 集合 确实 改进 了 内 置 的 集合 也 是 非常 重要 的 。 
例如 ， 我 们 或 许 想 要 创建 一 个 二 又 搜索 树 (binary search tree) 结构 用 来 让 所 有 的 元 数据 都 按 了 
确 的 顺序 存储 。 由 于 我 们 希望 这 是 一 个 可 变 的 结构 ， 因 此 在 设计 时 必须 做 下 面 的 几 件 导 
@ 设计 基本 的 二 又 搜索 树 结构 。 


@ ”决定 使 用 MutableSequence、MutableMapping 还 是 MutableSet 结构 作为 基 类 。 


@ 参考 Python 基本 库 文档 的 8.4.1 节 ， 了 解 collection.abc 的 集合 中 有 哪些 特殊 方法 。 
一 个 二 又 搜 索 树 的 节点 有 两 个 分 支 : 一 个 是 “小 于 ”分 支 ， 用 于 存放 所 有 小 于 当前 节点 的 键 ; 
男 一 个 是 “大 于 等 于 ”分 支 ， 用 于 存放 所 有 大 于 或 者 等 于 当前 节点 的 键 。 


我 们 需要 仔细 研究 如 何 让 我 们 的 集合 与 Python 的 抽象 基 类 合理 地 集成 。 
@ ”这 不 会 是 一 个 庞大 的 序列 ， 因 为 在 二 又 搜 索 树 中 我 
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] 通 常 不 使 用 索引 。 通 常 都 是 使 用 键 来 
用 对 应 元 素 。 但 是 ， 强 制 实现 一 个 整数 索引 页 不 是 难事 。 

可 以 作为 一 个 映射 的 键 , 可 以 让 所 有 的 键 按 顺 序 存储 。 这 是 二 又 搜 索 树 的 一 个 常见 用 途 。 
可 以 很 好 地 代 蔡 set 和 counter 类 ， 因 为 它 能 够 接受 多 个 不 同类 型 的 元 素 ， 这 让 我 们 
可 以 很 容易 地 将 它 实现 成 一 种 类 似 于 包 的 结构 。 


我 们 会 介绍 如 何 实现 一 个 有 序 的 多 重 集合 〈 或 者 叫 包 )。 这 个 结构 可 以 存储 一 个 对 象 的 多 份 备 
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份 。 它 只 是 依赖 于 对 象 间 相 对 简单 的 比较 测试 。 

这 是 一 个 比较 复杂 的 设计 ， 它 包括 了 很 多 细节 。 为 了 能 对 二 又 搜索 树 有 一 个 基本 了 解 ， 阅 读 类 
似 于 http://en.wikipedia.org/wiki/Binary_search_tree 上 面 的 文章 是 非常 重要 的 。 在 前 面 的 维基 百科 的 
末 页 有 许多 外 部 的 链接 ， 它 们 提供 了 关于 二 又 搜索 树 的 更 多 信息 。 阅 读 一 些 书 对 学 习 基本 的 算法 是 非 
常 重 要 的 ， 例 如 Cormen、Leiserson、Rivest 和 Stein 所 著 的 Introduction to Algorithms，Aho、Ullman 和 
Hopcroft 所 著 的 Data Structures and Algorithms， 或 者 Steven Skiena 所 著 的 The Algorithm Design Manual。 


6.7.1 一 些 设计 原则 
我 们 会 将 集合 分 成 两 个 类 : TreeNode 和 Tree。 
TreeNode 类 会 包含 所 有 的 元 素 和 more、less 和 parent 引用 。 我 们 也 会 将 一 些 其 他 功能 
放 在 这 个 类 中 。 
例如 ， 为 了 能 够 使 用 _contains__() 或 者 discard () 搜索 一 个 特定 的 元 素 会 用 一 个 简单 的 
归 将 这 个 搜索 工作 委托 给 节点 自身 来 完成 ， 算 法 的 描述 如 下 。 
@ 如 果 目 前 元 素 和 当前 元 素 相等 ， 那 么 返回 self。 
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@ 如果 目标 元 素 比 self.item 小 ， 那 么 递归 地 使 用 less.find(target item) 继续 搜 
索 目 标 元 素 。 

@ ”如果 日 标 元 素 比 self.item 大 , 那么 递归 地 使 用 more .fingd (target .item) 继续 搜索 
目标 元 素 。 





























我 们 用 类 似 的 方式 将 更 多 维护 树 结 构 的 工作 委托 给 TreeNode 类 完成 。 
第 2 个 类 会 使 用 外 观 模式 (Facade) 定义 Tree。 外 观 模式 也 被 成 为 包装 模式 〈Wrapper)， 主 要 目 
的 是 为 一 个 特定 的 接口 增加 属性 。 我 们 会 为 Mutableset 抽象 基 类 提供 必要 的 外 部 接口 。 

如 果 空 的 根 节点 在 比较 中 总 是 小 于 所 有 其 他 的 键 ， 这 个 算法 会 变 得 更 简单 ， 但 是 在 Python 中 这 
样 做 有 一 些 困 难 。 因 为 我 们 无 法 提前 知道 节点 会 是 哪 种 数值 类 型 ， 所 以 我 们 没有 办 法 容易 地 为 根 节 
点 定义 一 个 最 小 值 。 相 反 ， 我 们 将 使 用 特殊 值 None 并 且 接 受用 if 语句 检测 根 节点 所 带 来 的 开销 。 


6.7.2 定义 Tree 类 
这 是 Mutableset 类 的 一 个 扩展 的 主要 代码 ， 它 提供 了 所 必需 的 最 小 方法 集 。 




































































































































































































































































class Tree (Collections .abc.MutableSet) : 
def init ( self, iterable=None ) : 
self.root= TreeNode (None) 
self.size= 0 





if iterable: 
for item in iterable: 
self.root.add( item ) 
def add( self, item ) : 
self.root.add( item ) 


self.size += 1 
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def qiscardq( self, item ) : 
七 TY : 
self.root.more.remove( item ) 
self.size -= 1 





except KeyError: 
pass 
def contains ( self, item ) : 
try: 
self.root.more.find( item ) 
return True 





except KeyError: 
return False 
def iter ( self ): 
for item in iter(self.root.more): 
yield item 
def len ( self ): 


return self.size 

初始 化 方法 和 counter 对 象 类 似 ， 这 个 类 会 接受 一 个 可 人 迭代 对 象 作 为 参数 ， 并 加 载 对 象 中 的 
所 有 元 素 。 

add () 和 qiscard () 方法 会 持续 更 新 节点 总 数 。 这 样 当 我 们 需要 知道 当前 节点 总 数 时 ， 就 不 
用 遍历 整 棵 树 。 这 些 方 法 也 将 工作 委托 给 了 位 于 根部 的 TreeNode 对 象 。 

__contains () 特殊 方法 会 执行 递归 查找 。 当 发 生 KeyError 异常 时 ， 它 会 返回 False。 

_iter _() 特殊 方法 是 一 个 生成 器 函数 。 它 也 将 实际 的 工作 委托 给 了 TreeNode 类 的 递归 迭代 器 。 

我 们 定义 了 discard() ， 当 试图 忽略 不 存在 的 键 时 ， 可 变 集合 需要 这 个 方法 可 以 忽略 异常 。 抽 
象 基 类 中 提供 了 一 个 remove () 的 默认 实现 ， 当 一 个 键 不 存在 时 会 抛 出 一 个 异常 。 两 个 方法 函数 都 必 
须 定义 ， 我 们 基于 remove () 定义 了 discarqd ()， 但 是 会 忽略 键 不 存在 时 remove () 抛 出 的 异常 。 
在 一 些 情况 下 ， 基 于 discard() 定义 remove () 可 能 会 更 容易 ， 如 果 发 现 问题 就 抛 出 一 个 异常 。 


6.7.3 定义 TreeNode 类 


整个 Tree 类 都 是 依赖 于 TreeNode 类 来 处 理 添 加 、 删 除 和 迭代 包 中 的 不 同 元 素 。 这 个 类 比 
较 大 ， 所 以 我 们 会 分 3 个 部 分 展示 它 。 
这 里 是 第 1 部 分 ， 包 括 查 找 和 迭代 节点 。 


import weakref 





















































































































































class TreeNode: 
def _init ( self, item, less=None, more=None, parent=None ): 
self.item= item 
self.less= less 
self.more= more 
if parent != None: 
self.parent = parent 





@property 
def parent ( self ) : 
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return self.parent ref() 
@parent .setter 


def Parent ( self, value ) : 





self.parent ref= weakref.ref (value) 

self ): 

return( "TreeNode ({item!r},{less!r},t{ 
wsSelfs, dict HY ) 


def _ repr ( 


more!r})".format( 


def find( self, item ) : 
if self.item is None: # Root 
if self.more: return self.more.find(item) 
elif self.item == item: return self 
elif self.item > item and self.less: return 
self.less.find(item) 
elif self.item < item and self.more: return 
self.more.find(item) 
raise KeyError 
def iter ( self ): 


if self.less: 
for item in iter(self.less): 
yield item 
yield self.item 
if self.more: 
for item in iterl(self.more): 
yield item 

















我 们 定义 了 初始 化 两 种 不 同 节点 的 基本 方法 。 唯 一 必要 








引 ) 











更 多 弱 引 1 
父 节 点 对 象 和 它 的 孩子 节点 对 象 之 


难 。 





数 ， 


代 器 ， 但 是 这 样 做 没有 任何 好 处 ， 


j 都 作为 可 选 参数 。 














这 些 属性 用 来 确保 parent 属性 以 强 








引用 的 方式 出 现 











的 参数 为 元 素 本 身 ， 两 个 子 树 和 父 节点 


， 虽 然 实 际 上 它 是 weakref 属性 。 关 于 





























的 信息 ， 请 查看 第 2 章 “ 与 Python 无 颖 集成 
间 存 在 互相 引 
可 以 用 一 个 weakref 打破 这 种 循环 引用 。 


接 下 来 是 find () 方法 ， 它 会 递归 地 在 树 中 遍历 子 树 ， 




































































]， 这 种 循环 引用 让 删除 TreeNode 对 象 变 得 很 困 


基本 特殊 方法 ”。 在 一 个 TreeNode 

















搜索 目标 元 素 。 








__iter () 方 法 会 按 顺 序 裔 历 当前 节点 和 它 的 所 
它 从 每 一 个 子 树 集合 的 迭代 器 中 生成 要 返 
忆 为 生成 器 
下 面 是 这 个 类 的 第 2 部 分 ， 实 现 了 向 树 ， 
def add( self, 

if self.item is None: 
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Es 






























































item ): 

# Root Special Case 

if self.more: 
self.more.add( item ) 

elLSes 


了 子 树 。 和 往常 一 样 ， 这 是 一 个 生成 器 函 
的 值 。 尽 管 可 以 创建 一 个 基于 Tree 类 的 独立 迭 
数 可 以 完成 我 们 需要 的 所 有 功 
添加 新 节点 。 























全 已 
月 E 。 


self.more= TreeNode( item, parent=self ) 


elif self.item >= item: 
if self.less: 


self.less.add( item ) 


6.7 创建 一 种 新 的 集合 ”135 


else: 
self.less= TreeNode( item, parent=self ) 
elif self.item < item: 
if self.more: 
self.more.add( item ) 
ELSe: 
self.more= TreeNode( item, parent=self ) 


da 这 个 方法 的 结构 和 finq () 方法 类 1 
最 后 , 我 们 处 理 从 树 中 删除 节点 (更 复杂 )。 这 里 要 特别 注意 将 删除 后 丢失 的 节点 与 树 重 新 链接 起 来 。 


def remove( self, item ) : 
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# Recursive search for node 
if self.item is None or item > self.item: 
if self.more: 
self.more.remove (item) 


else: 





raise KeyError 
elif item < self.item: 
if self.less: 
self.less.remove (item) 
else: 
raise KeyError 
else: # self.item == item 
if self.less and self.more: # Two children are present 
successor = self.more. least() 





self.item = successor.item 





successor.remove (successor.item) 
elif self.less: # One child on less 
self. replace (self.1less) 
elif self.more: # On child on more 
self. replace (self.more) 
else: # Zero children 





self. replace (None) 

def least (self): 
if self.less is None: return self 
return self.less. least() 

def replace (self,new=None): 





if self.parent: 





if self == self.parent.less: 
self.parent.less = new 
else: 
self.parent .more = new 


if new is not None: 


new.parent = self.parent 


remove () 方法 有 两 个 部 分 。 第 1 部 分 是 递归 地 查找 目标 节点 。 
旦 找到 了 这 个 节点 ， 要 考虑 以 下 3 种 情况 。 
























































136 第 6 章 创建 容器 和 集合 






































当 删 除 一 个 没有 和 孩子 的 节点 时 ， 我 们 可 以 简单 地 删除 它 然后 将 与 父 节 点 的 引用 改 为 None。 

当 删 除 一 个 有 一 个 孩子 的 节点 时 ， 我 们 可 以 用 这 个 孩子 代 蔡 当前 节点 在 父 节点 中 的 引用 。 

当 有 两 个 孩子 时 ， 我 们 需要 调整 树 的 结构 。 我 们 首先 找到 后 继 节点 (在 more 子 树 中 的 最 小 节 

点 )。 可 以 用 这 个 后 继 节 点 的 值 蔡 换 准备 删除 的 节点 。 然 后 ,可 以 删除 之 前 那个 重复 的 后 继 节点 。 

我 们 依赖 于 两 个 私有 方法 。_least 方法 会 在 一 棵 给 定 的 树 中 查询 出 最 小 节点 。_replace () 
方法 检查 父 节 点 ， 以 确定 是 否 需要 更 新 less 或 者 more 属性 。 


6.7.4 ”演示 二 又 树 集合 


我 们 创建 了 一 个 全 新 的 集合 类 型 。 抽 象 基 类 的 定义 中 自 带 了 许多 方法 。 这些 继承 而 来 的 方法 可 
能 不 是 特别 高 效 ， 但 是 它们 已 经 定义 好 了 ， 可 以 正常 工作 ， 所 以 我 们 没有 重新 实现 它们 。 

>>> sl = Tree( ["Item 1", "Another", "Middle"] ) 

>>> list(s1) 

['Another', 'Item 1', 'Middle'] 

>>> len(s1) 
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>>> s2 = Tree( ["Another", "More", "Yet More"] ) 


>>> union= sl|s2 

>>> list (union) 

['Another', '‘'Another', 'Item 1', 'Middle', 'More', 'Yet More'] 
>>> len (union) 

6 

>>> union.remove ('Another') 

>>> list (union) 

['Another', ‘'Item 1', '‘'Middle', 'More', 'Yet More'] 


示例 向 我 们 展示 了 集合 的 union 运算 符 可 以 正常 工作 ,虽然 并 没有 特意 为 它 提供 实现 。 由 于 这 本 
质 上 是 一 个 包 ， 因 此 可 以 允许 元 素 重复 。 

































































6.8 总 结 
在 本 章 中 ， 我 们 介绍 了 很 多 内 置 类 。 对 于 大 多 数 设计 来 说 ， 内 置 的 集合 类 型 是 一 个 很 好 的 开始 。 











通常 我 们 会 以 tuple、1List、qict 或 者 set 开始 。 对 于 应 用 程序 中 的 不 可 变 对 象 ， 可 以 利用 

namedtuple () 创建 的 对 于 tuple 的 扩展 。 
除了 这 些 类 之 外 ，collections 模块 中 还 有 其 他 可 供 我 们 使 用 的 标准 库 类 型 。 
@ adqedue。 



























































@ ChainMap。 
@ OrqderedqDict。 


© Defaultqict。 
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@ Counter。 
同时 ， 我 们 有 3 种 标准 的 设计 原则 。 可 以 封装 任何 现存 的 类 型 ， 或 者 可 以 选择 扩展 一 个 类 。 
最 后 ， 我 们 也 可 以 创造 一 种 全 新 的 集合 。 这 需要 定义 许多 方法 名 和 特殊 方法 。 


6.8.1 设计 要 素 和 折 中 方案 

容器 和 集合 时 ， 我 们 将 以 下 步骤 作为 设计 原则 。 

1. 考虑 序列 、 映 射 和 集合 的 内 置 版 本 。 

2. 考虑 collections 模块 中 的 库 扩 展 和 一 些 其 他 的 集合 类 型 ， 例 如 neapq、bisect 和 
array。 

3. ”考虑 组 合 使 用 现 有 的 类 定义 。 在 许多 情况 下 ,一 个 tuple 对 象 的 1ist 或 者 是 包含 List 
的 aict 就 已 经 提供 了 必需 的 功能 。 

4. ”考虑 扩展 前 面 提 到 的 某 个 类 来 提供 额外 的 方法 或 者 属性 。 

5. ”考虑 用 封装 一 个 现 有 结构 的 方式 作为 提供 额外 方法 或 者 属性 的 男 一 个 途径 

6. 最后， 考虑 实现 一 个 新 的 数据 结构 。 通 常 ， 有 很 多 现成 的 资料 可 供 我 们 参考 。 可 以 从 维基 

百科 的 文章 开始 阅读 ， 例 如 : http://en.wikipedia.org/wiki/List_of_data_structures。 

旦 确定 了 设计 方案 ， 还 剩 两 个 部 分 需要 评估 。 

@ ”接口 要 如 何 兼容 我 们 的 问题 域 ， 这 相对 来 说 是 一 个 比较 主观 的 决定 。 

@ 用 timeit 评估 数据 结构 是 否 运 作 良 好 ， 这 是 一 个 完全 客观 的 结果 。 

避免 优 柔 袁 断 是 非常 重要 的 。 我 们 需要 高 效 地 找到 合适 的 集合 。 












































lk 
宣 






































































































































































































































在 大 多 数 情况 下 ， 最 好 能 分 析 一 个 现 有 的 应 用 程序 以 发 现 哪些 
些 情况 下 ， 在 开始 实现 之 前 ， 考 虑 一 个 数据 结构 的 复杂 性 就 能 知道 
或 许 最 重要 的 考虑 是 这 个 :“ 为 了 获得 最 佳 性 能 ， 避 和 免 搜索 ”。 
这 是 集合 和 映射 需要 可 哈 希 对 象 的 原因 。 定 位 集合 或 者 映射 中 的 可 哈 希 对 象 几乎 不 用 花 任 何 时 间 。 
通过 一 个 值 〈 不 是 索引 ) 在 一 个 1ist 查找 一 个 元 素 会 花费 大 量 的 时 间 。 
下 面 比较 用 错误 的 类 似 于 集合 的 方式 使 用 1ist 和 用 正确 的 方式 使 用 set。 


>>> import timeit 
























































些 数据 结构 带 来 了 性 能 瓶颈 。 在 一 
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站 能 
Be 
是 否 适合 某 个 特定 问题 。 
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>>> timeit.timeit( 'l.remove(10); l.append(10)', '1 = 
list(range (20))' ) 
0.8182099789992208 
>>> timeit.timeit( 'l.remove(10); 1l1.add(10)', '1 = set (range (20))" ) 
0.30278149300283985 


我 们 从 1ist 和 set 中 删除 、 添 加 一 个 元 素 。 
很 明显 ， 滥 用 1ist， 让 它 执行 类 似 于 set 的 操作 导致 运行 时 间 增 加 了 2.7 倍 。 
在 第 2 个 例子 中 ， 演 示 了 滥用 1ist， 让 它 执行 类 映射 的 操作 。 这 是 基于 一 个 真实 的 例子 ， 原 
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本 的 代码 使 用 了 两 个 平行 的 集合 模拟 映射 中 的 键 和 值 。 
接 下 来 比较 正确 地 使 用 映射 和 用 两 个 平行 的 List 模拟 映射 ， 如 下 所 示 。 


>>> 七 imeit .timeit ( 'i= k.index(10); v[i]= 0', 'k=list (range(20) ) 
v=list (range (20))" ) 

0.6549435159977293 

>>> timeit.timeit( 'm[10]= 0', 'm=dict (zip (list (range (20)),1list (ran 
ge(20))))" ) 

0.0764331009995658 

















在 平行 1ist 中 ， 我 们 用 一 个 1ist 查找 一 个 值 ， 然 后 再 将 值 存储 在 第 2 个 1ist 中 。 另 一 个 
例子 中 ， 只 是 简单 地 更 新 一 个 映射 。 

很 明显 , 在 两 个 平行 的 1ist 中 执行 查找 和 更 新 是 一 个 可 怕 的 错误 。 它 比 用 1ist .index () 定位 一 
个 元 素 多 花 了 8.6 倍 的 时 间 ， 因 为 后 者 通过 映射 和 哈 希 码 来 定位 一 个 元 素 。 


6.8.2 展望 
在 下 一 章 中 ， 我 们 将 仔细 探讨 内 置 的 数值 类 型 和 如 何 创建 新 的 数值 类 型 。 和 容器 一 样 ，Python 
提供 了 大 量 的 内 置 数值 类 型 。 当 创建 一 种 新 的 数值 类 型 时 ， 我 们 必须 定义 大 量 的 特殊 方法 。 


在 介绍 完 数值 类 型 之 后 , 我 们 会 探讨 一 些 更 复杂 的 设计 技巧 。 会 介绍 如 何 创 建 自 定义 的 装饰 器 
它们 来 简化 类 定义 。 我 们 也 会 介绍 如 何 使 用 mixin 类 定义 ， 这 和 抽象 基 类 的 定义 类 似 。 
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第 7 章 
创建 数值 类 型 





我 们 可 以 通过 扩展 numbers 模块 的 基本 抽象 类 来 创建 新 的 数值 类 型 。 对 于 一 些 应 用 场景 来 说 ， 
创建 自 定义 数值 类 型 比 起 使 用 内 部 类 型 可 能 更 合适 。 

需要 先 看 一 下 numbers 模块 中 的 抽象 部 分 ， 因 为 它们 是 内 部 的 抽象 基 类 。 在 开始 创建 新 的 数 
值 类 型 之 前 ， 了 解 已 有 的 数值 类 型 是 基本 的 。 
在 这 里 作为 一 个 题 外 话 ， 先 来 介绍 一 下 Python 中 从 运算 符 到 方法 的 映射 算法 。 思 路 是 这 样 的 ， 
二 进 制 运算 符 包 含 了 两 种 操作 ， 任 何 一 种 操作 都 可 以 定义 实现 运算 符 的 类 。 在 Python 中 ， 要 决定 实 
现 哪些 特殊 方法 之 前 ， 先 要 确定 对 相关 类 的 定位 规则 。 
基本 的 算数 运算 符 例 如 +、 一 、*、/、/W//、%% 和 ** 构 成 了 主要 的 数值 操作 。 还 有 一 些 其 他 的 运算 
符 ， 包 括 ^、| 和 廊 。 它 们 用 于 对 整数 进行 位 运算 ， 也 会 用 于 运算 集合 。 还 有 一 些 其 他 的 运算 符 ， 比 
如 <<、>>。 比 较 运算 符 在 第 2 章 “ 与 Python 无 颖 集成 一 一 基本 特殊 方法 ”中 已 经 介绍 过 了 ， 它 们 
包括 <、>、<=、>=、== 和 !=。 本 章 会 进一步 学 习 它们 。 
numbers 中 还 有 一 些 其 他 特殊 方法 , 包括 与 其 他 类 型 的 转换 。 Python 也 定义 了 一 些 原 地 运算 符 ， 
包括 +=、 一 =、*=、/=、//=、%=、**=、&=、|=、 人 ^、>>= 和 <<=。 比 起 numbers， 它 们 更 适用 于 不 
可 变 对 象 。 最 后 ， 会 总 结 一 些 在 进行 numbers 的 自 定义 和 扩展 时 需要 考虑 的 细节 。 


7.1 numbers 的 抽象 基 类 


numbers 包 提供 了 大 量 的 数值 类 型 ， 它 们 都 实现 了 numbers .Number。 另 外 ，fractions 
和 decimal 模块 提供 了 可 扩展 的 数值 类 型 : fractions .Fraction 和 decimal.Decimal。 

这 些 类 定义 基本 和 数学 中 数 的 分 类 是 一 致 的 。 如 果 要 了 解数 论 中 不 同 数 的 基本 概念 。 可 以 参见 
这 篇 文章 http:/en.wikipedia.org/wiki/Number theory。 

重点 是 计算 机 把 数学 中 的 抽象 实现 到 了 什么 程度 。 更 确切 地 说 ,我们 希望 在 数学 领域 任何 可 以 
计算 的 事物 都 可 通过 使 用 一 台 计 算 机 来 完成 。 所 谓 的 “完整 的 图 灵 ” 编 程 语言 是 说 ， 它 可 以 计算 由 
抽象 图 灵机 完成 的 任何 任务 ， 可 参见 这 篇 文章 http://en.wikipedia.org/wiki/ Computability theory。 

Python 定义 了 以 下 的 抽象 类 以 及 它们 相关 的 实现 。 这 些 抽象 类 的 关系 是 基于 继承 的 层次 结 
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构 。 可 以 先 看 看 这 些 类 的 功能 。 因 为 包含 的 类 很 少 ， 因 此 它们 的 关系 像 是 塔 而 不 是 树 。 


@ complex 实现 了 numbers .Complex 。 














@ float 实现 了 numbers.Real。 
@ fractions.Fraction 实现 了 numbers.Rational 。 


@ int 实现 了 numbers.Integral。 

















此 外 ， 还 有 decimal .Decimal， 昌 看 起 来 像 float， 但 它 不 是 numbers .Real 的 子 类 。 


仍 需 再 次 强调 一 下 。 


[总 float 的 值 仅仅 是 一 个 近似 值 ， 而 非 精确 值 。 虽 然 这 很 显然 ， 但 | 








不 要 对 此 感到 吃惊 。 以 下 是 应 用 式 子 人 全 jxA 求 似 值 的 例子 。 
>>> (3*5*7*11)/ (11*13*17*23*29) 

O00007123135264946712 

之 31 了 7 大 23 和 229 


105.00000000000001 








从 原则 上 来 说 ， 在 数 塔 中 ， 越 接近 塔 底部 的 数 ， 无 穷 大 阶 数 越 小 。 这 可 能 会 带 来 一 些 疑 惑 。 不 

















同 的 数字 都 定义 了 各 自 的 无 穷 大 阶 数 , 可 以 证 明 , 各 自 的 无 穷 大 阶 数 大 小 是 不 同 的 。 可 以 得 

















LZ 二 





LU 一 口 


论 ， 


原则 上 ， 浮 点 数 的 表示 比 整数 表示 包含 了 更 多 的 数字 。 实 际 上 ， 一 个 64 位 的 浮 点 数 和 64 位 的 整数 











包含 了 相同 数量 的 不 同 的 数字 。 
在 数值 类 型 的 定义 中 ， 包 含 了 一 系列 不 
能 的 ， 忆 此 需要 明确 的 定义 ， 哪些 类 型 之 









































下 入 





























@ complex: 它 无 法 转换 到 任 
分 ， 它 们 都 是 float。 


上 
Pr 


























类 型 之 间 的 转换 。 实 现 所 有 类 型 间 的 互 转 是 不 可 
可 以 转换 ， 哪些 类 型 之 间 不 能 转换 ， 如 下 是 一 


可 其 他 类 型 。 一 个 complex 值 可 被 分 解 为 real 和 imag 部 











@ float: 它 可 以 被 显 式 转换 到 任何 类 型 ， 包括 decimal .Decimal。 算 术 运 算 符 无 法 隐 式 


地 将 Eloat 值 转换 为 Decimal。 

















@ Fractions.Fraction:; 它 可 以 被 转换 到 除了 qecimal.Decimal 之 外 的 其 他 人 








E 何 类 


型 。 转 为 decimal 包括 了 两 部 分 操作 : (1) 转 为 float; (2) 转 为 dqecimal.Decimal。 


所 求 得 的 是 近似 值 。 
@ int: 可 以 被 转换 为 其 他 任何 类 型 。 
@ Decimal: 可 被 转换 为 其 他 任何 类 型 ， 但 算术 运算 符 不 会 隐 式 完成 转换 过 程 。 
以 上 的 转换 正 是 之 前 所 提 到 的 数 塔 中 每 种 数字 抽象 类 的 转换 。 












































gollall 


决定 使 用 哪 种 类 型 





























根本 不 会 使 月 


float 或 complex 以 及 
货币 计算 是 不 妥 的 。 


于 数字 处 理 





一 人 


位 运算 : 当 涉 及 位 和 字 节 上 
常规 情况 : 


中 和 非 十 进 千 














的 过 程 














存在 转换 ， 因 此 在 实际 中 3 


7.1 numbers 的 抽象 基 类 





和 = 王 人 人] 





到 如 下 4 类 问题 。 





上 上 妇 会 过 





复杂 类 型 : 一 旦 涉及 复杂 的 数学 操作 ， 将 会 使 用 
日 Fraction 或 者 Decimal。 可 是 ， 没 有 人 有 
大 多 数 数字 都 可 被 转换 为 复 
货币 类 型 : 对 村 
十 进 











有关 货 币 的 操作 ， 

















| 的 混合 计算 是 不 明智 


Hp 


必须 使 有 


























FE 何 理 




















类 刑 








有 
的 。 有些 场景 会 用 到 int 








名 全 人 几 





会 RE 








Decimal 混合 计算 。 应 当 记 得 ， 浮 点 数 只 是 近似 值 ， 








9 计算 








6 











,JBN 





除 上 述 之 外 的 








E 何 数值 类 型 。 





其 他 情况 。 对 于 
Fraction 都 是 可 以 互 转 的 。 是 的 , 对 于 


它 将 很 好 地 支持 外 Python 中 的 类 





J 函 
型 ， 尤 3 








数 来 说 , 总 是 可 以 很 
其 是 float 和 int， 








Decimal。 一 般 地 ， 进 行货 币 计算 时 ， 进 
可 是 也 不 建议 
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complex、float 和 cmath 模块 。 可 能 
由 要 给 数值 类 型 强加 限 第 


| ， 
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行 
与 





























规 的 数学 运算 来 说 ，int、float 和 





好 地 支持 多 态 ， 


将 经 常 涉及 隐 


式 转换 。 从 这 点 来 看 ， 为 这 类 问题 选择 一 个 特殊 的 数值 类 型 是 没有 意义 的 。 


一 般 一 个 问题 包含 了 几 个 方面 
用 ， 和 一 些 包 含 了 金融 、 货 币 以 及 
制 ， 对 数值 类 型 使 








值 类 型 的 使 有 
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7.1.2 


算术 运算 符 (+、 一 、*、/、//、% 和 
算 时 ，+ 运 算 符 会 被 映射 为 一 个 
“ adq (133) 。 其 : 


355. 





限 








。 通 常情 况 下 ， 




















、 








要 把 一 些 涉及 科学 或 工程 
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| 算 以 及 复杂 数字 的 应 
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小 数 计算 的 应 











区 分 开 来 并 不 算 难 。 在 应 


























方法 解析 和 运算 符 映 射 
I** 等 ) 都 会 映射 为 方法 。 例 如 ， 








数字 类 中 
单 的 规则 ， 
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个 简 

















不 仅 如 此 。 当 表达 式 包 含 了 复杂 类 型 ，Python 


考虑 7-0.14 这 样 的 表达 式 。 左 边 操作 数 为 int 类 型 ， 
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过 市 





来 了 一 点 复杂 性 





上 ， 因为 int 











失 精 度 。 医 











数 是 一 个 int 类 型 
的 值 来 说 会 损失 精度 ; 然而 , 超大 int 只 是 针对 特殊 情况 在 技术 上 
_rsub () 操 作 是 反 疝 减法 


对 应 的 操作 序 


用 


是 1 














] isinstance () 进行 检测 并 加 以 类 型 























制 是 ; 


民 制 
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的 _adgq _() 方 法 。 


进行 355+133 这 档 
以 上 的 计算 可 以 写作 


程序 中 大 可 放宽 对 数 
浪费 时 间 的 做 法 。 


的 运 











那 就 是 最 左边 的 运算 符 决 定 J 





要 使 














哪个 类 。 




















会 分 别 调用 两 个 操作 数 类 中 各 


六 刀 











这 衣 





自 特殊 方法 的 实现 。 

表达 式 被 相应 转换 为 7. sub (0.14)。 
运算 符 的 参数 为 0.14， 是 float 类 型 ， 而 从 float 转 int 会 损 
为 从 高 精度 往 低 精 度 转 总 会 损失 精度 。 


对 于 float 的 转换 情景 ， 表 达 式 可 以 为 : 0.14. rsup (7)。 EF 的 话 ，f1loat 运算 符 的 参 











J， 值 为 7， 从 int 往 ELoat 类 











。 例 妇 
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1,X. sub _(Y) 对 应 
B-A， 方 法 的 实现 来 自 右边 的 操作 数 类 。 可 以 
左边 操作 数 类 中 的 运算 符 特 殊 方 法 ， 如 
外 这 条 规则 。 





型 转 并 不 会 〈 通 常 ) 损失 精度 。( 对 了 





























的 一 种 实现 ， 

















的 ] 





看 到 以 下 两 点 规则 。 








全 











般 情况 下 不 会 用 到 。 
操作 就 是 Xx-Y, 而 A. 


超大 int 类 型 
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B) 








到 

















_rsub ( 


返回 值 为 NotImplemented 则 执行 
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@ ”尝试 调用 右边 操作 数 中 的 运算 符 特殊 方法 。 如 果 返 回 值 为 NotImplemented， 则 抛 出 异常 。 
当 两 个 操作 数 构成 继承 关系 时 ， 这 种 情况 需要 注意 。 以 下 规则 会 作为 特殊 情况 被 优先 执行 。 

@ ”如 果 右 边 操 作 数 是 左边 操作 数 的 子 类 并 且 子 类 中 定义 了 运算 符 特殊 方法 的 实现 , 那么 该 方 

法 会 被 调用 。 子 类 中 重 写 的 运算 符 特殊 方法 并 会 被 调用 ， 尽 管 它 处 于 运算 符 的 右边 。 

@ 否则， 执行 之 前 提 到 的 规则 ， 从 左边 操作 数 开始 判断 。 

假设 实现 了 float 的 子 类 MyFloat。 对 于 这 样 的 表达 式 2.0 - MyFloat (1) ， 右 边 的 操作 
。 由 于 它们 构成 了 继承 关系 ，Python 会 先 尝试 调用 MyFloat (1) . 
rsub (2.0)。 这 条 规则 的 关键 点 是 ， 子 类 的 优先 级 高 。 

es 个 类 需要 转换 就 必须 实现 之 前 所 提 到 的 ， 包括 反 向 操作 符 。 当 实现 或 扩展 一 
个 数值 类 型 ， 也 必须 相应 提供 从 该 类 型 到 其 他 可 转换 类 型 的 行为 。 


7.2 算术 运算 符 的 特殊 方法 


一 共有 13 个 二 进 制 运算 符 以 及 相关 的 特殊 方法 。 先 关注 一 些 常用 的 算术 运算 符 。 如 下 面 表格 
所 示 ， 每 个 特殊 方法 名 对 应 一 个 各 自 的 运算 符 ( 函 数 )。 











































































































































































































































































































方法 运算 符 
object. add (self, other) 二 
object. sub (self, other) > 
object. mul (self, other) 

object. truediv (self, other) y4 

object. floordiv (self, other) A 
object. mod (self, other) 多 

object. divmod (self, other) divmod () 函数 
object. pow (selLlf，other[，moqdqulol]) pow () 函数 和 ** 











以 上 运算 符 中 包含 了 两 个 函数 。 还 有 很 多 特殊 方法 , 也 对 应 了 一 元 运算 符 和 函数 , 如 下 表 所 示 。 



































方法 运算 符 
object. neg (self) 三 

object. pos (self) 十 

object. _ abs (self) abs () 函数 
object. complex (self) complex () 函数 
object. int (self) int () 函数 
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方法 运算 符 

object. float (self) float () 函数 
object. round (self[, n]) round () 函数 
object. trunc (self[，Dn]) math .上 runc () 函数 
object. ceil (self[, n]) math.ceil() 函数 
object. floor (self[, n]) math.floor() 函数 




















以 上 列表 包含 了 很 多 函数 。 可 以 使 用 Python 的 内 部 追踪 ， 看 看 内 部 的 具体 细节 。 以 下 定义 了 
个 简单 的 追踪 函数 ， 来 看 一 下 其 中 的 部 分 细节 。 


def trace( frame, event, arg ): 












































if frame.f code.co name.startswith(" "): 
print( frame.f code.co name, frame.f code.co filename, event ) 


这 个 函数 会 打印 出 名 称 以 " "为 起 始 的 特殊 方法 名 称 ， 可 以 使 用 如 下 代码 把 这 个 追踪 函数 安装 
到 Python 中 。 


























import sys 
sys.settrace (trace) 









































旦 完成 安装 ， 系 统 中 任何 执行 代码 都 会 经 过 trace () 函数 。 我 们 会 过 滤 出 所 有 特殊 方法 名 
有 件 。 接 下 来 会 定义 一 个 内 部 类 的 子 类 ， 以 探究 方法 的 解析 规则 。 


class noisyfloat( float ) : 
def _ addq ( self, other ) : 
print( self, "+", other ) 
return super(). add ( other ) 
def radd ( self, other ): 
print( self, "r+", other ) 
return super(). radd ( other ) 
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这 个 类 只 重 载 了 运算 符 中 的 两 个 特殊 方法 。 当 执行 noisyfloat 值 的 加 法 时 , 会 看 到 打印 出 的 
运算 符 相 关 的 统计 人 信息。 而且， 追踪 信息 会 告诉 我 们 发 生 了 什么 。 如 下 代码 演示 了 Python 为 一 个 给 
定 运算 符 选择 类 的 过 程 。 


>>> x = noisyfloat (2) 
>>> x+3 

_add <stdin> call 
2%0 二 ,3 

5:a0 

> > p< 

_radd <stdin> call 
和 20 人 上 这 

4.0 
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> 2 3 

_add <stdin> call 
2,0. "2..3 

4.3 

>>> 2.3+x 

_radd <stdin> call 
20 于 -和 ;33 

4.3 




















从 x+3 开始 ， 可 以 看 到 noisyfloat+int 是 如 何 将 int 对 象 值 3 提供 给 ”adg () 方 法 的 。 这 
个 值 传 入 了 基 类 float 中 , 将 3 转换 为 float 类 型 并 做 加 法 。 而 2+x 则 演示 了 noisyfloat 类 的 运 
算 符 右边 的 加 法 函数 是 如 何 被 调用 的 。int 再 次 被 传 入 基 类 中 进而 被 转换 为 float 。 对 于 表达 式 
x+2.3， 我 们 得 知 noisyfloat+float 使 用 了 运算 符 左边 的 子 类 中 的 加 法 函数 。 相 应 地 ， 对 于 表达 
式 2.3+x 而 言 ，float+noisyfloat 则 使 用 了 运算 符 右 边 的 子 类 中 的 反 向 加 法 函数 _ raqqd__() 。 


7.3 创建 一 个 数字 类 


接 下 来 会 定义 新 的 数值 类 型 。 由 于 Python 已经 提供 了 不 定 精度 的 整数 类 型 、 实 分 数 、 标 准 浮 
点 数 以 及 货币 计算 用 到 的 小 数 ， 因 而 简化 了 这 项 任务 。 我 们 将 定义 一 个 “ 带 比 例 ” 的 数字 类 。 这 个 
类 包含 了 一 个 整数 和 一 个 比例 因数 ， 可 用 于 货币 计算 。 对 于 世界 上 的 许多 货币 来 说 ， 可 以 进行 100 
以 内 的 货币 计算 。 

使 用 比例 计算 的 好 处 是 可 以 通过 使 用 底层 的 硬件 指令 来 简化 实现 。 为 了 利用 硬件 完成 计算 ， 可 
将 这 个 模块 用 C 语言 完成 。 而 创建 一 种 新 的 比例 计算 又 显得 有 些 多 余 ， 因 为 在 decimal 的 包 中 已 
经 对 小 数 计算 提供 了 很 不 错 的 支持 。 

我 们 会 命名 它 为 FixedPoint 类 ， 因 为 小 数 的 小 数 点 位 数 是 固定 的 。 而 比例 因数 定义 为 一 个 整 
数 ， 通 常 为 10 的 次 容 。 原 则 上 ， 使 用 2 的 N 次 暴 作 为 比例 因数 会 更 快 ， 但 并 不 适合 货币 计算 。 

使 用 2 的 次 蝴 作 为 比例 因数 会 快 的 原因 是 可 以 将 value * (2**scale) 替换 为 value << 
scale， 将 value/(2 ** scale) 蔡 换 为 value >> scale。 而 左右 位 运算 通常 由 硬件 指令 完 
成 ， 因 此 相 比 乘除 运算 会 更 快 。 

里 想 情况 下 ， 比 例 因数 为 10 的 六 次 需 ， 但 不 会 强制 要 求 这 一 点 。 为 了 同时 追踪 次 方 数 和 比例 因数 ， 
这 里 可 作为 一 个 扩展 点 。 可 将 2 存 为 次 方 数 ， 而 10? - 100 则 为 因数 。 我 们 简化 了 类 的 实现 ， 只 追踪 因数 。 


7.3.1 FixedPoint 的 初始 化 
我 们 将 从 初始 化 部 分 开始 ， 包 含 了 从 不 同类 型 到 FixedPoint 值 的 转换 操作 ， 如 下 所 示 。 


import numbers 
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import math 


class FixedPoint ( numbers.Rational ) : 
__slots = ( "value", "scale", "default format" ) 
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def new ( cls, value, scale=100 ) : 
self = super(). new (cls) 
if isinstance (value,FixedPoint): 
self.value= value.value 
self.scale= value.scale 
elif isinstance (valuey int) : 
self.value= Value 
self.scale= Scale 
elif isinstance (value,float): 





self.value= int (scale*value+.5) # Round half up 








self.scale= scale 





else: 





raise TypeError 
digits= int( math.logl0( scale ) ) 
self.default format= "{{0:.{digits}f}}".format (digits=digits) 
return self 
def _ str ( self ): 
return self. format ( self.default format ) 
def repr: ( ‘Self }3 








return "{ class . name :s}({value:d},scale={scale:d})". 
format ( class =self. Cclass , value=self.value, scale=self.scale ) 
def format ( self, specification ) : 
if specification == "": specification= self.default format 


return specification.format( self.value/self.scale ) # no 

rounding 
def numerator( self ) : 
return self.value 

def denominator!( self ): 
return self.scale 





FixedPoint 类 继承 自 numbers .Rational。 接 下 来 会 包含 两 个 整数 值 scale 和 value， 
以 及 分 数 的 一 般 定义 。 这 将 需要 定义 大 量 的 特殊 方法 ， 因 为 初始 化 是 针对 不 可 变 对 象 的 ， 因 此 会 
写 _new _() 方 法 而 非 _init __() 方 法 。 为 了 阻止 添加 属性 ， 限制 了 slots 的 数量 。 初始化 包括 
了 如 下 的 几 种 转换 。 
@ 如 果 赋 值 的 对 象 类 型 为 FixedqPoint， 将 复制 内 部 属性 并 创建 新 的 FixedPoint 对 象 ， 就 
是 对 原 对 象 进行 克隆 。 尺 管 它 将 有 唯一 的 ID ， 但 它 将 有 相同 的 哈 希 值 用 来 比较 对 象 是 否 
相等 ， 使 得 克隆 对 象 和 原 对 象 基 本 没有 区 别 。 
@ 如果 赋 值 的 对 象 类 型 为 整数 或 有 理 数 〈int 或 float )， 它 们 用 于 为 value 和 scale 属性 赋值 。 
@ 可 以 加 入 对 decimal.Decimal 和 fractions .Eraction 的 处 理 逻 辑 以 及 字符 串 解析 。 
我 们 定义 了 3 种 特殊 方法 来 返回 字符 串 : __ ser __()、 () 和 ”format ()。 对 于 格式 
化 的 操作 ， 会 重用 格式 规范 语言 中 已 有 的 浮 点 数 功 能 。 既 然 是 有 理 数 操作 ， 因 此 还 需 提供 分 子 和 分 
母 的 相应 操作 方法 。 
我 们 仍 可 以 从 封装 已 有 的 fractions .Fraction 类 为 开始 。 而 且 ， 会 看 几 种 不 同 的 四 舍 五 
入 规则 。 在 使 用 这 个 类 解决 具体 问题 之 前 ， 应 对 此 进行 合理 谨慎 的 定义 。 
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7.3.2 ”定义 固定 小 数 点 位 数 的 二 








进 制 算术 运算 符 











创建 一 个 新 的 数字 类 的 唯一 
value 和 scale， 可 以 看 作 是 这 种 形式 的 ; A- 公 ， 
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原因 就 是 要 重 载 算术 运算 符 。 每 个 FixedPoint 对 象 包 含 了 两 部 分 






























































































































































































































































在 如 下 的 例子 中 , 使 用 了 一 种 正确 但 并 不 高 效 的 浮 点 数 表 达 式 来 完成 代数 运算 。 接 下 来 会 讨论 
一 种 相对 高 效 的 实现 方式 ， 纯 整数 操作 。 

加 法 《和 减法 ) 的 一 般 形式 是 这 样 的 ，A+B= 他 -+ 局。 可 是 它 产生 了 多 位 无 效 
的 精度 。 

比如 使 用 9.95 加 上 12.95， 我 们 会 得 到 (原则 上 〉229000/10000。 可 被 约 分 化 简 为 2290/100， 
进一步 化 简 为 229/10, 而 它 已 经 不 再 是 美 分 了 。 在 实际 场景 中 , 对 于 分 数 不 会 追求 约 分 到 最 简 形 式 ， 
以 确保 它们 仍 能 表达 美 分 或 米尔 。 

对 于 AtB= 人 + ， 可 以 想到 两 个 例子 。 

e 比例 因数 匹配 :这 种 情况 下 ， 所 求 的 和 为 AtB= 人 + 也" = 人 一 当 进 行 FixedPoint 或 

整数 类 型 加 法 运算 时 ， 同 样 会 有 效 。 因 为 可 以 让 整数 在 计算 时 也 使 用 比例 因数 。 

e@ 比例 因数 不 匹配 :正确 的 做 法 是 先进 行 通 分 ， 即 R_= max(A。 BJ)。 从 这 点 来 看 ， 可 以 计算 

和 。 这 些 比例 因数 中 的 一 个 值 将 为 1， 另 一 个 会 小 于 1。 先 进行 通 分 ， 得 到 代数 式 : 
Ne | 
Re : 。。 这 个 等 式 在 两 种 情况 下 可 化 简 ， 一 种 是 因数 为 1， 另 一 
R 
A, B.— : 
> A， B. 
种 则 为 10 的 指数 的 情况 。 

无 法 对 对 法 做 真正 意义 上 的 优化 。 对 于 基本 的 式 子 AXB= 他 -x= AD 。 当 对 Pixedpoint 
的 值 做 乘法 运算 时 ， 精 度 会 提高 。 

除 是 乘法 的 逆 运 算 ， A+B= x 和 ee 。 如 果 A 和 了 的 比例 相同 ， 那 么 就 可 以 再 稍微 优 
化 一 下 ， 把 这 些 值 进行 约 分 。 然 而 ， 这 会 导致 误差 范围 从 美 分 变 到 全 部 ， 这 种 做 法 不 是 很 受 当 。 下 
例 是 一 些 前 置 运算 符 的 模板 定义 。 

def add ( self, other ) : 


if not isinstance (other,FixedPoint): 


new _ scale= self.scale 


def 


def 


def 


def 


def 


def 


7.3 创建 一 个 数字 类 


new Value= self.value + otherxself.scale 


else: 


new scale= max (self.scale, other.scale) 


new value= (self.value* (new scale//self.scale) 


+ other.value* (new scale//other.scale)) 


return FixedPoint 


( int (new value), scale=new scale ) 


_sub ( self, other ): 


if not isinstance 


(other,FixedPoint): 


new_ scale= self.scale 


new value= self.value - other*self.scale 


else: 


new scale= max (self.scale, other.scale) 


new value= (self.value* (new scale//self.scale) 


— other.value* (new scale//other.scale)) 


return FixedPoint 


int (new value), scale=new scale ) 


_mul ( self, other ) : 


if not isinstance 
new scale= Se] 
new Value= Se] 
else: 
new_ scale= Se] 
new value= se] 
return FixedPoint 
_truediv ( self, 


if not isinstance 


other,FixedPoint): 
lf.scale 
lf.value * other 


lf.scale * other.scale 
lf.value * other.value 
int (new value), scale=new scale ) 
other ) : 
other EixedqPoint) : 





new value= int (self.value / other) 


else: 


new value= int (self.value / (other.value/other.scale)) 


return FixedPoint( new value, scale=self.scale ) 


__ floordiv ( self, other ) : 





if not isinstance (other,FixedPoint): 


new value= int (self.value // other) 


else: 


new value= int (self.value // (other.value/other.scale)) 


return FixedPoint 


new value, scale=self.scale ) 





_mod ( self, other ) : 
if not isinstance (other,FixedPoint): 

new value= (self.value/self.scale) % other 
else: 


new value= sel 


9 


f.value %$ (other.value/other.scale) 


return FixedPoint( new value, scale=self.scale ) 








_ Pow ( self, other ) : 
if not isinstance (other,FixedPoint): 
new value= (self.value/self.scale) ** other 
else: 
new value= (self.value/self.scale) ** (other.value/other. 


scale) 


return FixedPoint( int (new value)*self.scale, scale=self.scale 
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对 于 简 和 
进一步 优化 的 版 本 。 
对 于 这 两 种 除法 mod 





除法 操 














的 加 减 和 乘法 运算 ， 为 了 消除 一 


() 和 


Pow 








也 许 会 使 用 











会 是 整数 ， 
操作 数 所 需 的 精度 。 


7.3.3 定义 FixedPoint 一 元 算术 运算 符 
如 下 是 一 元 运算 符 函 数 的 定义 。 




















和 可 以 适当 地 减 小 比例 因数 ,这 点 是 



































些 相 对 缓慢 的 浮 点 产生 的 中 间 结 果 , 我 们 可 以 使 用 被 


() 方 法 ， 并 没有 针对 浮 点 数 除 法 进行 优化 。 相 反 ， 
我 们 提供 了 一 种 Python 中 的 实现 方式 以 及 单元 测试 ， 它 们 将 作为 优化 和 重 构 的 出 发 点 。 
重要 的 。 然 而 ， 有 时 也 是 不 值得 的 。 对 于 并 发 场景 ， 




















EF 发 风 从 《小 时 除 以 沪 这 GET0 玉 得 到 像 生 小 时 区 天 元 这 样 用 后 素 二 二 二 风 后 洒 









































AS 人 











比例 为 1， 不 过 或 许 也 希望 结果 会 以 分 为 单位 ， 比 例 为 100。 这 种 实现 可 确保 运算 符 左 边 














































































































ceil () 和 floor () 运算 符 来 说 , 可 通过 Python 
























































def abs ( self ): 
return FixedPoint( abs(self.value), self.scale ) 
def float ( Self ): 
return self.value/self.scale 
def int ( self ): 
return int (self.value/self.scale) 
def trunc ( self ): 
return FixedPoint( math.trunc(self.value/self.scale), self. 
scale ) 
def ceil ( self ): 
return FixedPoint( math.ceil(self.value/self.scale), self. 
scale ) 
def floor ( self ): 
return FixedPoint( math.floor(self.value/self.scale), self. 
scale ) 
def _round ( self, ndigits 
return FixedPoint( round(self.value/self.scale, ndigits=0), 
self.scale ) 
def: neg ( self ): 
return FixedPoint( -self.value, self.scale ) 
def pos ( self ): 
return self 
对 于 _round ()、_trunc ()、 
类 库 中 的 函数 来 实现 。 可 以 对 它们 进一步 优化 ， 但 我 们 这 里 只 取 浮 点 数 的 近似 值 ， 并 使 用 它 来 构造 
最 终结 果 。 这 些 方 法 确保 了 FixedPoint 对 象 可 以 与 很 多 算术 运算 函数 进行 有 效 的 交互 。 在 Python 
中 有 很 多 运算 符 ， 这 还 不 是 全 部 ， 这 里 还 没有 包含 比较 运算 符 和 位 运算 符 。 
i . . Dm ra Way 
7.3.4 ”实现 FixedPoint 反 向 运算 符 
反 向 运算 符 会 在 如 下 两 种 场景 中 用 到 。 
@ 右 操 作 数 类 是 左 操作 数 类 的 子 类 。 这 种 情况 下 ， 反 向 运算 符 会 优 








先 选择 子 类 中 的 实现 。 
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@ 左 操作 数 的 类 没有 实现 所 需 的 特殊 方法 。 这 种 情况 下 ， 将 使 用 右 操作 数 的 反 向 特殊 方法 。 























下 表 列 出 了 反 向 特殊 方法 与 运算 符 之 间 的 映射 关系 。 











方法 运算 符 
object. radd (self, other) 二 
object. rsub (self, other) SS 
object. rmul (self, other) 六 

object. rtruediv (self, other) / 

object. rfloordiv (self, other) // 
object. rmod (self, other) 多 

object. rdivmod (self, other) divmod () 
object. rpow (self, otherl[, modulol]) Pow()， 或 xx 



































这 些 反 向 运算 符 特殊 方法 也 可 使 用 公共 的 模板 来 创建 。 由 于 它们 是 反 向 的 ， 进 行 减 、 除 、 取 模 
以 及 乘 方 运算 时 ， 顺 序 是 很 重要 的 。 对 于 可 交换 的 运算 ， 例 如 加 和 乘 运算 ， 顺 序 就 不 是 很 重要 。 如 
下 是 一 些 反 向 运算 符 的 定义 。 


def 


def 


def 


def 














_radd ( self, other ): 


if not isinstance (other,FixedPoint): 

new scale= self.scale 

new value= other*self.scale + self.value 
else: 

new scale= max (self.scale, other.scale) 





new value= (other.value* (new scale//other.scale) 
+ self.value* (new scale//self.scale)) 


return FixedPoint( int (new value), scale=new scale ) 


_rsub ( self, other ): 


if not isinstance (other,FixedPoint): 
new scale= self.scale 
new value= other*self.scale - self.value 
else: 
new scale= max (self.scale, other.scale) 
new value= (other.value* (new scale//other.scale) 





- self.value* (new scale//self.scale)) 


return FixedPoint( int (new value), scale=new scale ) 


rmul ( self, other ): 


if not isinstance (other,FixedPoint): 
new scale= self.scale 
new value= other*self.value 

else: 
new scale= self.scale*other.scale 
new value= other.value*self.value 


return FixedPoint( int (new value), scale=new scale ) 


rtruediv ( self, other ) : 
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if not isinstance (other,FixedPoint): 
new value= self.scale*int (other / (self.value/self.scale)) 
e196 
new value= int ((other.value/other.scale) / self.value) 
return FixedPoint( new value, scale=self.scale ) 
def rfloordiv ( self, other ) : 
if not isinstance (other,FixedPoint): 





new value= self.scale*int (other // (self.value/self. 
scale)) 
else: 
new value= int((other.value/other.scale) // self.value) 
return FixedPoint( new value, scale=self.scale ) 
def rmod ( self, other ): 
if not isinstance (other,FixedPoint): 
new value= other $% (self.value/self.scale) 
else: 





new value= (other.value/other.scale) % (self.value/self. 
scale) 
return FixedPoint( new value, scale=self.scale ) 
def rpow ( self, other ): 
if not isinstance (other,FixedPoint): 
new value= other ** (self.value/self.scale) 
else: 
new value= (other.value/other.scale) ** self.value/self. 
scale 
return FixedPoint( int (new value)*self.scale, scale=self.scale 


) 


我 们 已 经 对 每 种 运算 符 对 应 的 数学 运算 进行 了 尝试 。 思 路 就 是 以 简单 的 方式 交换 每 种 操作 数 。 
这 是 最 常见 的 场景 。 匹 配 的 正 向 和 反 向 的 方法 可 以 简化 代码 审查 的 工作 。 

使 用 正 向 运算 符 ， 并 不 会 对 除法 、 取 模 和 乘 方 运算 符 进 行 优化 。 当 FixedPoint 转 为 浮 点 数 ， 
再 转换 回来 时 会 导致 数值 不 精确 。 


7.3.5 “实现 FixedPoint 比较 运算 符 
以 下 是 6 组 比较 运算 符 以 及 它们 对 应 的 特殊 方法 。 




































































































































































方法 运算 符 
object. 1]t (self, other) < 
object. le (self, other) < 二 
object. eq (self, other) 三 三 
object. ne (self, other) != 
object. gt (self, other) > 
object. ge (self, other) > 三 
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is 运算 符 会 比较 对 象 的 ID 。 想不到 合适 的 目的 来 重 写 此 行为 , 因为 相对 于 其 他 的 特殊 类 而 言 ， 





它 是 独立 的 。in 比较 运算 符 


说 是 没有 意义 的 。 


























object. contains ( self，value ) 实现 。 这 对 于 数值 来 








可 以 注意 到 关于 比较 的 测试 是 一 项 特别 的 工作 。 由 于 浮 点 数 是 近似 值 ， 在 进行 浮 点 数 的 比较 测 
试 时 就 要 非常 小 心 。 我 们 需要 了 解 它 们 的 值 是 否 在 一 个 足够 小 的 范围 内 ， 即 最 小 误差 值 ， 而 不 应 写 
为 a == bp。 一 般 要 比较 浮 点 数 的 近似 值 的 表达 式 为 abs (a - b) <= eps。 更 确切 一 些 ， 可 以 写 





作 abs(a - b)/a <= eps。 








最 小 误差 值 为 0.01。 可 实际 上 我 












































在 FixeqPoint 类 中 ， 使 用 比例 来 定义 两 个 浮 点 数值 可 被 视 为 相等 的 程度 。 对 于 比例 100 来 说 ， 
































门 会 更 保守 一 些 ， 当 比例 为 100 时 ， 会 使 用 0.005 作为 最 小 误差 值 。 





进一步 说 ， 需 要 判断 FixedPoint (123，100) 与 ERixedPoint (1230,1000) 是 否 相 等 。 尽 





























管 在 数学 上 是 等 同 的 ， 可 一 个 





位 是 美 分 ， 一 个 是 米尔 ， 这 也 算是 两 个 数 精 度 不 同 的 一 种 原因 。 使 









































用 额外 的 有 效 位 可 来 标识 在 比较 时 不 视 作 相等 ， 如 果 这 样 做 ， 也 当 确保 哈 希 值 是 不 同 的 。 













































































辨别 不 同 的 比值 对 于 应 用 程序 来 说 是 不 合适 的 。 因 为 我 们 期 望 FixedPoint (123，100) 与 
这 


FixedPoint (1230，1000) 两 数 是 相等 的 。 





同样 也 是 _hash _() 函数 实现 的 背后 所 假设 的 。 














以 下 是 FixedPoint 类 中 比较 操作 的 实现 。 


def eq ( self, other ): 


if isinstance( 


other, FixedPoint): 


if self.scale == other.scale: 
return self.value == other.value 
else: 
return self.value*other.scale//self.scale == other. 
value 
eelsSe; 
return abs(self.value/self.scale - float (other)) < .5/ 
self.scale 
def ne ( self, other ): 
return not (self == other) 


def le ( self, other ) : 
return self.value/self.scale <= float (other) 


def— 1t 1{ Selfy other )s 


return self.value/self.scale < float (other) 


def ge ( self, other ): 


return self.value/self.scale >= float (other) 


def. ot. (SeLlfy OENer. 














return self.value/self.scale > float (other) 


每 个 比较 函数 需要 接收 一 个 非 FixedPoint 类 型 的 值 。 唯 一 的 要 求 是 另 一 个 值 必须 包含 浮 点 数 












































的 表示 方式 。 而 我 们 已 经 为 


FixedPoint 对 象 定义 了 一 个 float () 方 法 ， 在 比较 两 个 








FixedPoint 值 时 ， 比 较 运算 符 就 会 完好 地 工作 。 
不 必 为 所 有 的 6 种 比较 操作 提供 实现 。 Qfuctools.total ordering 装饰 器 可 以 从 两 个 



































FixedPoint 值 

















生成 缺失 的 方法 。 我 们 会 在 第 8 章 “ 装 饰 器 和 mixin 一 一 横 切 方面 ”中 再 次 回顾 
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这 部 分 内 容 。 


7.4 





我 们 需要 恰当 地 定义 _hash _() 方 法 。 


计算 一 个 数字 的 哈 希 值 











关于 数值 类 型 哈 希 值 计 算 ， 也 可 参见 Python 标准 库 





















































(Python Standard Library) 中 的 4.4.4 节 部 分 
所 推荐 的 一 种 做 法 。 下 


def hash ( self ) : 
P = sys.hash info.modulus 





























o 


面 是 我 们 的 一 种 做 法 。 


那 部 分 定义 了 一 个 hash_fraction() 函数 ， 是 我 们 


mr n = self.value, self.scale 


# Remove common factors of P. 


(Unnecessary if m and n already 


coprime.) 

while m % P == n % P == 0: 
m, n=m//P,n//P 

if n $$ P == 0: 
hash = sys.hash info.inf 

else: 
# Fermat's Little Theorem: pow(n, P-1, P) is 1, so 
# pow(n, P-2, P) gives the inverse of n modulo P. 
hash = (abs(m) $% P) * pow(n, P -2, P) %$P 

EE me 0 
hash = -hash 

if hash == -1: 
hash = -2 


return hash 


它 将 有 理 分 式 的 两 部 分 化 简 





为 一 部 分 ， 就 是 标准 的 哈 希 值 。 











与 参考 文档 的 实现 相 比 ， 这 段 代码 























做 了 一 些 修改 。 要 强调 的 是 计算 
分 母 ， 民 
首先 , 我 们 可 以 (而 且 应 该 ) 修 改 _new__ 




















过 程 的 核心 音 
1 mod P。 我 们 可 以 针对 具体 问题 对 上 


分 ， 分 子 乘 以 分 母 的 倒数 。 实 际 上 ， 也 就 是 分 子 除 以 
进行 优化 。 
() 方法 来 确保 比值 为 非 0, 消除 对 sys .has_info.inf 



































的 依赖 。 其 次 ， 应 显 式 限 制 比例 因数 的 取 值 范 




















要 比 sys .hash info.modulus (对 于 64 位 的 计算 


韦 




















机 来 说 ， 此 值 为 24-1) 小 。 可 以 消除 对 需要 
hash (abs (m) %$ P) 

















和 








* pow(n ，P -2，P) 








除 的 常用 因数 P 的 依赖 。 这 样 一 来 ， 散 列表 达 式 将 为 
P， 信 号 处 理 和 特殊 情况 中 的 -1 被 映射 为 了 -2。 

















器 
LU 








@ 
-5 






































最 终 ， 或 许 希望 对 计算 出 的 哈 希 值 提供 记忆 化 功能 。 这 需要 一 个 额外 的 
1 次 哈 希 值 被 访问 时 所 求 得 的 计算 结果 。pow (n ，BP - 2，P) 表 达 式 在 使 




































































此 对 于 不 必要 的 场景 通常 不 用 。 


设计 更 有 用 的 四 舍 五 入 方法 


在 显示 四 售 五 入 的 值 时 ， 通 
要 更 多 的 解释 说 明 。 这些 定 义 对 于 抽象 基 类 来 


的 计算 过 程 中 ， 我 们 通常 
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在 货币 








常会 做 截断 。 








地 方 ， 用 来 存放 仅 当 第 
j 时 显得 不 够 轻 量 ， 
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我 们 定义 了 所 需 的 round () 和 trunc () 函数 ， 不 需 
不 足以 满足 我 们 的 需求 。 




















会 编写 如 下 代码 。 


>>> price= FixedPoint( 1299, 100 ) 
>>> tax rate= FixedPoint( 725, 1000 ) 
>>> price * tax rate 

FixedPoint (941775,scale=100000) 


然后 ， A dal 得 到 942 这 个 值 。 将 一 个 数值 基于 一 个 新 的 
























































盎 


范围 进行 四 舍 五 入 (和 截断 ) 的 操作 ， 需 要 一 些 方法 来 做 这 件 事 。 如 下 是 一 个 用 来 完成 对 特定 的 范 








TH 
xd 











做 四 舍 五 入 的 方法 。 











7. 


def round to( self, new scale ) : 
f = new scale/self.scale 
return FixedPoint( int (self.value*f+.5), scale=new scale ) 


如 下 代码 可 用 来 重 设 四 舍 五 入 范围 。 


>>> price= FixedPoint( 1299, 100 ) 
>>> tax rate= FixedPoint( 725, 1000 ) 
>>> tax= price * tax rate 

>>> tax.round to (100) 
FixedPoint (942, scale=100) 


以 上 演示 了 计算 货币 所 必需 的 函数 的 定义 。 


5 实现 其 他 的 特殊 方法 


有 关 重 要 的 算术 和 比较 运算 符 , 还 包括 一 组 加 法 运算 符 ， 只 有 numbers .Integral 类 型 的 值 





































































































会 用 到 。 由 于 我 们 不 会 去 定义 整数 ， 因 此 可 以 暂时 跳 过 这 些 特殊 方法 。 
方法 运算 符 
object. lshift (self, other) << 
object. rshift (self, other) >> 
object. and (self, other) & 
object. xor (self, other) 
object. or (self, other) 





当然 也 包括 与 这 些 运算 符 相关 的 反问 版 本 。 











方法 运算 符 
object. rlshift (self, other) << 
object. rrshift (self, other) >> 
object. rand (self, other) & 
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方法 运算 符 





object. rxor (self, other) 





object. ror (self, other) | 











补充 一 点 ， 还 有 一 个 有 关 位 运算 值 的 取 反 操作 。 














方法 运算 符 








object. invert (self) << 














用 在 了 集合 和 整数 中 ， 并 没有 在 有 
样 的 。 





YH 


里 数 中 使 用 它们 。 定 义 这 








有 趣 的 是 ， 这 些 运算 符 中 的 一 些 
运算 符 的 原则 与 其 他 算术 运算 符 是 


7.6 原 地 运算 符 的 优化 


一 般 地 ， 数 值 是 不 可 变 的 。 然 而 ， 数 值 运算 符 也 被 用 于 可 变 对 象 。 例 如 1ist 和 set， 对 于 一 
些 扩展 的 赋值 运算 符 来 说 ， 同 样 是 支持 的 。 作 为 一 种 优化 方式 ， 一 个 类 中 可 包含 一 个 运算 符 的 原 地 
运算 版 本 , 这 些 方法 都 为 可 变 对 象 的 赋值 运算 做 了 扩展 。 注意 , 这 些 方法 最 终 都 会 以 return self 
作为 返回 值 ， 使 得 赋值 运算 更 流畅 。 


被 



































































































































方法 运算 符 
object. iaddq (self, other) 十 二 
object. isub (self, other) 一 二 
object. imul (self, other) 大 一 
object. itruediv (self, other) /= 
object. ifloordiv (self, other) //= 
object. imod (self, other) 名 = 
object. ipow (self, other[, modulo]) We 
object. ilshift (self, other) <<= 
object. irshift (self, other) >>= 
object. iand (self, other) &= 
object. ixor (self, other) 人 ^= 
object. ior (self, other) I 


























于 FixedPoint 对 象 是 不 可 变 的 ， 因 此 我 们 不 应 对 它们 进行 修改 。 除 了 这 个 例子 以 外 ， 将 看 
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到 有 关 原 地 运算 符 的 一 个 更 典型 的 应 用 。 我 们 可 以 简单 地 为 21 点 游戏 中 的 Hand 对 象 定义 一 些 原 地 
运算 符 。 比 如 将 如 下 定义 加 入 Hand 类 














def iadd ( self, aCard ) : 
self. cards.append( aCard ) 
return self 




















这 样 一 来 ， 就 可 以 使 用 如 下 代码 来 完成 发 牌 。 
player hand += deck.pop() 


以 上 代码 优雅 地 实现 了 手中 牌 的 更 新 操作 。 























A A 总结 
































我 们 已 经 介绍 了 内 置 的 数值 类 型 ， 也 看 了 很 多 在 创建 新 数值 类 型 时 所 需 的 特殊 方法 。 特 殊 的 数值 类 
型 可 以 与 Python 其 余部 分 无 颖 集成 , 是 这 个 语言 的 一 大 特色 。 除非 使 用 得 当 , 否则 并 不 意味 着 工作 的 简化 。 


7.7.1 设计 要 素 和 折 中 方案 

当 使 用 数值 时 ， 设 计 分 为 以 下 几 步 。 

1. ”考虑 使 用 内 部 版 本 的 complex、float 和 int 类 型 。 

2. ”考虑 类 库 的 扩展 部 分 ， 例 如 qecimal 和 fractions。 对 于 金融 领域 的 计算 ， 一定 要 使 
用 decimal， 它 是 唯一 的 选择 。 

3.， 考虑 使 用 方法 或 属性 扩展 以 上 所 述 的 几 种 类 型 。 

4. ”最 终 , 考虑 创建 新 的 数值 类 型 。 这 是 非常 有 挑战 的 ， 而 Python 中 可 

设计 新 的 数值 类 型 需要 考虑 如 下 几 点 。 

@ 完整 性 与 一 致 性 : 一 个 新 的 数值 类 型 必须 包含 了 完整 的 操作 和 集合 并 且 在 所 有 的 表达 式 中 它 
们 的 行为 是 一 致 的 。 对 于 有 计算 能 力 的 新 数值 类 型 ， 重 点 在 于 需要 为 正式 的 数学 定义 提供 
相应 的 实现 。 

@ 适用 于 问题 的 领域 : 这 个 数值 合适 吗 ? 它 是 否 为 一 个 明确 的 解决 方案 ? 

@ 性能: 正如 所 有 设计 所 遇 到 的 问题 ， 我 们 需要 确保 其 足够 高 效 。 比 如 本 章 的 例子 中 ， 使 用 
了 一 些 并 不 高 效 的 浮 点 数 操作 ， 它 们 可 以 通过 一 些 数 学 技巧 和 少量 代码 进行 优化 。 


7.7.2 ”展望 
在 下 一 章 中 ， 会 使 用 装饰 器 和 mixin 来 对 类 的 设计 进行 简化 和 标准 化 。 我 们 可 以 使 用 装饰 器 来 
定义 一 些 功能 ， 它 们 可 以 被 用 在 很 多 类 中 ， 但 这 些 类 的 关系 并 非 只 是 简单 继承 。 类 似 地 ， 可 以 使 用 


mixin 的 类 定义 从 组 建 类 的 定义 中 创建 一 个 完整 的 应 用 程序 类 。 装 饰 器 的 好 处 之 一 就 是 定义 比较 运 
算 符 ， 即 Gfunctools.total ordering 装饰 器 。 













































































































































































的 数值 类 型 已 经 很 丰富 了 。 
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第 8 章 
装饰 器 和 mixin 一 一 横 切 方面 


一 个 软件 的 设计 通常 会 包括 一 些 跨越 了 不 同 的 类 、 函 数 和 方法 的 方面 。 有 关 技 术 方 面 的 例子 , 包 
括 日 志 、 设 计 和 安全 ， 这 些 方面 必须 有 一 致 地 实现 。 在 面向 对 象 编程 中 ， 重 用 功能 的 通用 方法 是 继承 
一 个 类 。 但是， 继承 并 不 总 是 最 合适 的 方案 。 在 软件 设计 中 ， 有 一 些 方面 和 类 层次 结构 是 正 交 的 。 这 
些 通常 被 称 为 “ 横 切 关注 点 ”(cross-cutting concerns )。 它 们 会 跨越 多 个 类 ， 让 设计 变 得 更 加 复杂 。 
装饰 器 提供 了 一 种 不 用 和 继承 结构 绑 定 的 定义 功能 的 方法 。 我 们 可 以 用 装饰 器 设计 应 用 程序 中 
的 某 个 方面 ， 然 后 将 装饰 器 应 用 于 类 、 方 法 或 者 函数 。 
另外， 我 们 可 以 谨慎 地 使 用 多 重 继 承 创建 横 切 方面 (Cross-outting Aspects)。 会 考虑 用 一 个 
基 类 加 上 mixin 类 的 方式 来 引入 新 功能 。 通 常 ， 我 们 会 使 用 mixin 类 创建 横 切 方面 。 
值得 注意 的 是 , 横 切 关注 点 很 少 限 定 于 当前 的 应 用 程序 , 它们 通常 是 通用 的 设计 。 常见 的 日 志 、 
审计 和 安全 的 例子 可 以 被 认为 是 项 目 基 础 架构 的 一 部 分 ， 与 应 用 程序 的 细节 是 独立 的 。 

Python 内 置 了 许多 装饰 器 ,我 们 可 以 扩展 这 些 标准 的 装饰 器 。 在 一 些 不 同 的 应 用 场景 中 ,我 们 
会 介绍 简单 的 函数 装饰 器 、 带 参数 的 函数 装饰 器 、 类 装饰 器 和 方法 装饰 器 。 
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对 象 的 一 个 基本 特性 就 是 它们 可 以 被 分 类 。 每 一 个 对 象 都 属于 一 个 类 。 这 是 对 象 和 类 之 间 的 一 
种 简单 关系 ， 它 只 需要 一 个 简单 的 、 单 继承 的 设计 。 
如 果 考 虑 多 重 继承 , 分 类 的 问题 就 变 得 复杂 了 。 当 我 们 审视 真实 世界 中 的 物体 时 , 例如 咖啡 杯 ， 
我 们 可 以 很 容易 地 将 它们 归 类 为 容器 。 毕 竞 , 那 是 咖啡 杯 的 主要 用 途 。 它们 解决 的 问题 就 是 装 咖 啡 。 
是 ， 在 另外 一 种 环境 中 ， 我 们 可 能 会 对 其 他 的 用 途 感 兴趣 。 对 于 一 个 装饰 性 的 陶瓷 杯 ， 相 比 于 一 
个 杯子 在 装 咖 啡 方面 的 能 力 ， 我 们 可 能 对 尺寸 、 形 状 和 釉 彩 更 感 兴趣 。 
大 多 数 对 象 与 类 之 间 都 是 简单 的 is-a 关系 。 在 我 们 装 咖啡 问题 中 , 桌 上 的 杯子 是 咖啡 杯 的 同时 
个 容器 。 对象 与 其 他 一 些 类 之 间或 许 也 能 有 acts-as 的 关系 。 如果 我 们 把 一 个 杯子 当成 陶瓷 艺 
就 会 考虑 它 的 尺寸 、 形 状 和 釉 彩 。 如 果 把 一 个 杯子 当成 纸 镇 ， 就 会 考虑 它 的 重量 和 摩擦 力 。 
这 些 额 外 的 属性 可 以 被 看 成 是 mixin 类 ， 它 们 定义 了 一 个 对 象 的 附加 接口 或 者 行为 。 
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进行 面向 对 象 设 计时 ， 通 常 都 会 先 确定 is-a 的 类 和 这 个 类 的 一 些 基 本 定义 。 其 他 的 类 型 可 以 混 
合 在 对 象 所 附加 的 接口 或 者 行为 中 。 我 们 会 介绍 如 何 创建 和 装饰 类 。 会 从 定义 函数 和 装饰 开始 ， 
为 这 比 创建 一 个 类 要 简单 一 些 。 


8.1.1 创建 国 数 


创建 一 个 函数 分 两 步 。 第 1 步 是 带 有 原始 定义 声明 的 def 语句 。 




















































































































~ 理论 上 , 是 可 以 用 lambda 表达 式 和 赋值 语句 创建 一 个 函数 的 , 但 
QQ 是 我 们 会 避免 这 样 做 。 




















一 个 def 语句 提供 了 一 个 名 称 、 变 量 、 默 认 值 、 一 个 docstring、 一 个 代码 块 和 一 些 其 他 的 
细节 。 一 个 函数 是 11 个 属性 的 集合 , 这 是 标准 的 类 层次 结构 , 定义 在 Python 语言 参考 (Python Language 
Reference) 的 3.2 节 中 。 可 以 参考 http://docs.python.org/3.3/ reference/datamodel.html#the-standardtype-hierarchy。 

第 2 步 是 将 一 个 装饰 器 应 用 在 原始 定义 上 。 当 我 们 将 装饰 器 (@qd) 应 用 到 一 个 函数 (F) 上 时 ， 
结果 就 好 像 是 创建 了 一 个 新 的 函数 ，F’=@q (F) 。 函 数 名 相同 ， 但 是 依据 增加 、 删 除 或 者 修改 的 属 
性 不 同 ， 功 能 会 有 所 不 同 。 然 后 ， 我 们 会 有 下 面 这 样 的 代码 。 


Qdecorate 




























































































def function() : 
Pass 


装饰 器 直接 写 在 函数 定义 之 前 。 内 部 发 生 的 过 程 是 : 


def function() : 























Pass 
function= decorate( function ) 


装饰 器 修改 函数 定义 ， 然 后 创建 了 一 个 新 的 函数 。 下 面 是 函数 的 属性 列表 。 
















































































属性 说 明 

_doc docstring 或 者 None 

_ name 函数 的 初始 名 称 

_module 函数 所 属 的 模块 名 称 ， 或 者 None 

_ qualname 函数 的 全 名 : module .name 

_ defaults 默认 的 参数 值 ， 如 果 没 有 默认 参数 就 是 None 
__ kwdefaults 只 有 关键 字 (keyword-only) 的 参数 的 默认 值 
_code 这 个 对 象 代表 编译 后 的 函数 体 











dict 函数 属性 的 命名 空间 
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续 表 
属性 说 明 
annotations 参数 的 注释 ， 包 括 “return” 为 返回 值 的 注释 
_globals 函数 所 属 模块 的 全 局 命名 空间 ， 这 个 属性 用 于 解析 只 读 的 全 局 变量 
__ closure | 与 函数 中 的 自由 变量 (free variables) 的 绑 定 或 者 为 None。 它 是 只 读 的 






































装饰 器 可 以 改变 除 _globals ”和 ” closure 之 外 的 其 他 所 有 属性 。 但 是 ， 我 们 稍 后 会 看 
到 ， 这 些 摆 弄 得 太 深 不 是 非常 实际 。 

在 实践 中 ， 装 饰 通常 包括 定义 一 个 封装 了 现 有 函数 的 新 函数 。 可 能 需要 复制 或 者 修改 前 面 的 一 
些 属 性 。 在 实践 中 ， 这 就 限制 了 一 个 装饰 器 能 做 什么 和 应 该 做 什么 。 


8.1.2 创建 类 


创建 类 是 一 组 散 套 的 两 级 过 程 。 外 部 对 类 方法 的 引用 让 类 的 创建 变 得 更 加 复杂 ， 因 为 这 涉及 多 
步 查找 。 对 象 的 类 中 会 定义 方法 解析 顺序 “Method Resolution Order，MRO) 。 这 定义 了 一 个 基 
类 如 何 定义 一 个 属性 或 者 方法 。MRO 会 顺 着 继承 层次 向 上 查找 ; 这 意味 子 类 中 的 名 称 会 覆盖 基 类 
中 的 名 称 。 用 这 种 方式 实现 的 搜索 符合 对 继承 的 预期 。 
类 创建 的 第 1 阶段 是 带 有 原始 定义 的 class 语句 。 这 个 阶段 会 首先 执行 元 类 型 ， 然 后 执行 赋 
值 语句 和 类 中 的 qef 语句 。 正 如 之 前 说 的 ， 类 中 的 每 一 个 def 语句 都 会 被 翻译 成 一 个 组 套 的 两 级 函 
数 创建 。 装 饰 器 可 以 作为 创建 类 过 程 的 一 部 分 ， 应 用 于 每 个 函数 方法 。 
类 创建 的 第 2 阶段 是 将 一 个 全 局 的 类 装饰 器 应 用 于 类 定义 。 通 常 ， 一 个 decorator 函数 可 以 增 
加 功能 , 较为 常见 的 是 添加 属性 而 不 是 添加 方法 。 但 是 , 我 们 也 会 看 到 有 一 些 添加 方法 和 函数 的 装饰 器 。 
很 明显 ， 不 可 以 通过 装饰 器 修改 从 基 类 继承 的 功能 ， 因 为 它们 在 方法 解析 查找 的 过 程 中 是 延迟 解析 
的 。 这 带 来 了 一 些 重 要 的 设计 要 素 。 通 常 ， 我 们 用 类 或 者 mixin 类 引入 方法 。 但是， 我 们 只 用 装饰 器 或 者 
mixin 类 定义 引入 属性 。 下 面 是 类 中 内 置 的 一 些 属 性 ， 其 他 的 许多 属性 是 元 类 型 的 一 部 分 ， 如 下 表 所 示 。 




























































































































































































































































































































































































































































































属性 说 明 

aoc | 类 的 文档 字符 串 〈documentation string )， 如 果 没 有 定义 就 是 None 
_ name 类 名 

_ module 类 所 属 的 模块 名 

_dict 包含 类 命名 空间 的 
































包含 了 基 类 的 元 组 (有 可 能 为 空 或 者 是 一 个 单 例 ), 基 类 以 基 类 列表 中 的 顺序 存储 ; 




























































































_bases | i 
它 用 来 处 理 方法 的 解析 顺序 
Class | 当前 类 的 基 类 ， 通常 是 type 类 型 
类 中 另外 的 一 些 方法 函数 包括 ”subclasshook 、 reduce 和 reduce ex ， 都 属于 
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pickle 接口 。 


8.1.3 一 些 类 设计 原则 
当 定 义 类 时 ， 我 们 的 属性 和 方法 有 下 面 3 种 来 源 。 
@ class 语句 。 
@ 类 级 的 装饰 器 。 
@ mixin 类 和 最 后 一 个 基 类 。 
我 们 需要 定义 每 种 来 源 的 可 见 级 别 。class 语句 是 属性 和 方法 的 最 明显 来 源 。mixin 和 基 类 相 比 
于 类 主体 而 言 ， 显 得 不 够 明确 。 基 类 名 称 可 以 阐明 它 的 基本 用 途 这 一 点 是 很 有 帮助 的 。 我 们 会 尽量 
用 现实 世界 中 的 对 象 来 命名 基 类 。 
mixin 类 通常 会 定义 类 中 额外 的 接口 或 者 行为 。 了 解 如 何 使 用 mixin 类 对 于 创建 最 终 的 类 很 
要 。docstring 类 是 其 中 一 个 重要 的 部 分 , 同时 ,docstring 模块 对 于 展示 如 何 将 多 个 不 同 部 分 
组 成 一 个 正确 的 类 也 是 非常 重要 的 。 
当 使 用 class 语句 时 , 类 自身 的 基 类 放 在 最 后 , mixin 类 在 基 类 之 前 。 这 不 仅仅 是 习惯 而 已 。 
放 在 最 后 的 类 是 is-a 类 。 装 饰 器 的 应 用 将 带 来 一 些 比 较 模 糊 的 行为 。 通 常 ， 装 饰 器 提供 的 行为 相 
对 少 一 些 。 关 注 其 中 的 一 个 或 者 几 个 行为 可 以 帮助 我 们 弄 清 装饰 器 的 作用 。 


8.1.4 面向 方面 编程 
面向 方面 编程 《Aspect-oriented programming) 的 某 些 部 分 与 装饰 器 相关 。 我 们 的 目的 是 利用 
面向 方面 编程 的 概念 来 讲解 Python 中 的 装饰 器 和 mixin 类 。 横 切 关注 点 是 AOP 的 核心 。 这 里 有 横 切 关注 
点 的 背景 知识 : http://en.wikipedia.org/wiki/Cross-cutting_concern。 下 面 是 一 些 关于 横 切 关注 点 的 常见 示例 。 
@ 日 志 (Logging): 我 们 常常 需要 为 不 同 的 类 实现 统一 的 日 志 记 录 功 能 。 需 要 确保 日 志 的 命 
名 统一 ， 并 且 日 志 事件 也 与 类 结构 一 致 。 
@ 审计 (Auditability): 另外 一 种 记录 日 志 的 方式 是 提供 一 种 审计 机 制 ， 用 于 追踪 可 变 对 象 
的 每 次 转换 。 在 许多 商业 应 用 程序 中 ， 交 易 是 一 种 商业 记录 ， 它 代表 账单 或 者 付款 信息 。 
处 理 一 条 商业 记录 的 每 个 步骤 都 应 该 是 可 审核 的 ， 以 确保 在 处 理 过 程 中 没有 任何 错误 
@ 安全 (Security): 我 们 的 应 用 程序 会 经 常 有 安全 方面 的 需求 ， 涵 盖 了 每 一 个 HTTP 请 求 和 
网 站 下 载 的 所 有 内 容 。 这样 做 的 目的 是 为 了 确保 每 个 请 求 都 是 由 有 权利 发 起 请 求 的 认证 用 
户 发 起 的 。 我 们 必须 始终 使 用 Cookies、 安 全 套 接 字 (secure sockets) 和 其 他 的 加 密 技术 来 
确保 整个 Web 应 用 程序 的 安全 性 。 
一 些 语言 和 工具 对 AOP 提供 了 强大 的 支持 。Python ff 
包括 下 面 的 语言 特性 。 
@ ”装饰 器 : 利用 装饰 器 ， 我 们 可 以 通过 函数 的 两 个 简单 连接 点 之 一 来 创建 统一 的 横 切 方面 实 
现 。 我 们 可 以 在 现 有 函数 执行 之 前 或 者 之 后 执行 横 切 方面 的 逻辑 。 在 函数 的 代码 中 ， 我 们 
很 难 找到 连接 点 。 对 于 装饰 器 来 说 ， 封 装 函数 或 者 方法 并 提供 额外 的 功能 是 修改 一 个 函数 
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一 些 














































































































































































































































































































































































































了 其 中 的 一 些 概念 。Python 风格 的 AOP 


we 
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8. 








日 
碟 


方法 函数 会 被 调用 。 我 人 


2 


Python 语言 
标注 类 的 方法 。eproperty 装饰 器 将 一 个 方法 函数 转换 成 描述 器 。 我 们 | 
定义 方法 函数 。 当 
建 setter 和 deleter 





Qclassmethod 和 @staticmethod 装饰 器 ; 
法 现在 可 以 用 类 调用 ， 而 不 是 对 象 。 对 于 静态 方法 ， 没 
类 是 该 方法 的 第 1 个 参数 。 下 








装饰 器 和 mixin 一 一 横 切 方面 


























或 者 方法 的 最 简单 方式 。 












































mixin: 利用 mixin 能 够 做 到 在 一 个 单独 的 类 层次 结构 之 外 定义 男 一 个 类 。 将 mixin 类 与 其 
他 类 一 起 使 用 可 以 为 横 切 方面 提供 一 致 的 实现 。 为 此 , 被 扩展 的 类 必须 使 用 mixin 的 API。 
通常 ， 我 们 将 mixin 类 当 作 抽 象 类 ， 因 为 我 们 无 法 用 一 种 有 意义 的 方式 来 初始 化 它们 。 


使 用 内 置 的 装饰 器 































































































置 了 一 些 装饰 器 。Qproperty、Q@classmethod 和 estaticmethod 装饰 器 用 



























































这 种 简单 属性 语法 来 
于 方法 上 时 ， 也 会 额外 创建 一 对 属性 ， 它 们 可 以 用 于 创 
3 章 “ 属 性 访问 、 特 性 和 修饰 符 ” 中 讲解 过 这 个 部 分 。 

各 一 个 方法 函数 转换 成 一 个 类 级 函数 。 被 装饰 的 方 
有 显 式 的 类 引用 。 另 一 方面 ， 对 于 类 方法 ， 
四 是 一 个 包含 了 @staticmethod 和 一 些 Qproperty 的 类 的 例子 。 















































将 @property 装饰 器 用 


属性 。 我 们 在 第 


































































































class Angle( float ) : 
slots = ( " degrees", ) 
@staticmethod 


def from radians( value 


大 


这 个 类 
义 了 from radians() 方 法 函数 ， 它 会 返回 
于 类 本 身 并 返 
男 外 ,我们 提供 了 degrees () 和 radians () 方法 函数 ， 它 们 都 被 Gpropery 





属性 。 


return Angle (180*value/math.pi) 


def new ( cls, value ): 
self = super(). new (cls) 
self. degrees= value 
return self 

@property 


def radqians ( 


self ) : 
return math.pi*self. degrees/180 


@property 


def qedgrees ( 





SElf )s 
return self. degrees 


定义 了 一 个 可 以 用 度 或 者 弧度 表示 的 Angle 类 。 构 造 器 以 度 为 参数 。 但 是 ， 我 们 也 定 
一 个 本 类 的 实例 。 这 个 函数 不 能 通过 实例 调 
回 一 个 当前 类 的 实例 。_new__() 方法 是 一 个 隐 式 的 类 方法 ， 装 饰 器 对 它 没有 用 。 
所 装饰 ， 所 以 它们 都 
































J， 岗 






































、 























实 ， 这 些 装 饰 器 会 创建 一 个 描述 器 ， 这 样 当 访 问 属性 名 degrees 或 者 radians 时 ， 同 名 的 


















































] 可 以 用 static 方法 创建 一 个 实例 ， 然 后 通过 property 访问 一 个 方法 函数 。 





>>> b=Angle.from radians (.227) 
>>> b.degrees 
13.006141949469686 








(a 











i 


静态 方法 实际 上 是 一 个 函数 ， 
j Angle.from radians 比 调 ) 








姑 为 它 与 self 实例 变量 无 关 。 它 的 优点 是 它 的 语法 直接 与 类 绑 


一 个 名 为 angle_from radians 的 函数 更 为 直观 。 使 用 这 






































8.3 








些 装饰 器 可 以 确 


使 用 标准 库 中 的 阎 饰 絮 
标准 库 中 有 许 


保 实现 的 正确 性 





和 一 致 性 。 
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多 装饰 器 。 例 如 contextlib、functools、 unittest、 atexit、 importlib 
布 器 。 例 如 ，functools 


() 和 1 ()、 












































云 算 。 人 只 定义 了 两 种 


和 repr1lib 模块 都 包含 了 可 以 作为 软件 设计 中 横 切 方面 的 经 典范 例 的 装 

库 提供 了 total ordering 装饰 器 ， 它 定义 了 一 系列 比较 运算 符 。 它 用 eq 
le _()、_gt _() 或 者 _ge __() 中 的 一 个 创建 一 套 完整 的 比较 运 

比较 运算 的 card 类 。 





import functools 
Qfunctools.total ordering 
class Card: 


Slots = ( "rank", "suit"™ ) 
def new ( cls, rank, suit ) : 
self = super(). new (cls) 


self.rank= rank 

self.suit= suit 

return self 

_éq (selfy other ): 

return self.rank == other.rank 
_]lt ( self, other ): 

return self.rank < other.rank 


我 们 的 类 被 一 个 类 级 的 装饰 
为 我 们 创建 未 定义 的 方法 函数 。 可 以 用 这 个 类 创建 支持 所 有 比较 运 
了 两 个 。 下 面 是 使 用 我 们 定义 的 和 未 定义 的 比较 运算 符 的 例子 。 


3, 
3, 


























>>> cl1l= Card( 
Cardl( 


== C2 


Ta!' ) 
>>> c2= 'y'! ) 
>>> cl 
True 
>>> cl < 
False 
>>> cl 


True 





pp 





True 


上 面 的 代码 展示 了 我 们 可 以 进行 类 
类 定义 中 。 


8.3 使 用 标准 库 中 的 mixin 类 


标准 库 使 用 了 mixin 类 定义 。 有 许多 模块 ， 


urllib.request、contextlib 和 collections.abc。 




















未 定义 的 比较 运 




































































器 所 包装 起 来 , @functools.total ordering。 


去 算 符 的 对 象 ， 


这 个 装饰 器 会 
虽然 在 类 中 只 定义 











云 算 。 装 饰 器 将 缺少 的 方法 函数 添加 到 原始 





都 有 这 种 例子 ， 包 括 io、socketserver、 
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当 我 们 基于 collections .abc 抽象 基 类 自 定 义 集合 时 ， 我 们 会 使 用 mixin 类 确保 容器 的 横 切 


方面 都 以 一 致 的 方式 定义 。 最 上 层 的 集合 (Set 、Sequence 和 Mapping) 都 是 基于 多 个 mixin 类 





























创建 的 。 仔 细 读 一 读 Python 标准 库 的 8.4 节 是 非常 重要 的 ， 它 介绍 了 mixin 是 如 何 为 类 提供 
因为 总 体 的 类 结构 是 由 许多 不 同 部 分 组 成 的 。 































































































功能 的 ， 


只 看 其 中 一 行 , Sequence 的 总 结 , 我 们 可 以 看 到 它 继承 自 Sized、Iterable 和 Container。 


这 些 mixin 类 提供 了 contains ()、 iter ()、 reversed ()、 index () 和 count () 








方法 。 


8.3.1 使 用 上 下 文 管理 纶 的 mixin 类 
对 象 和 上 下 文 的 使 用 ”中 讲解 上 下 文 管理 器 时 , 我 们 忽略 了 ContextDe 






























































es 





在 第 5 章 “ 可 调 
这 个 mixin 类 ， 而 是 主要 关注 上 下 文 管理 器 















































在 前 面 的 例子 中 ， 我 们 创建 了 一 个 修改 全 局 状态 的 上 下 文 管理 器 ， 
ul 它 会 重 置 随机 数 种 子 。 我 们 会 修改 这 个 设计 ， 让 Deck 类 可 以 作 
[ea 为 自己 的 上 下 文 管理 器 。 当 作为 上 下 文 管理 器 使 用 时 ， 它 可 以 生 
成 一 定数 量 的 Card。 这 并 不 是 为 一 副 牌 做 单元 测试 的 最 好 方法 。 
但 是 ， 这 是 一 种 使 用 上 下 文 管理 器 的 简单 方式 。 




















将 上 下 文 管理 定义 为 程序 中 的 mixin 类 时 需要 注意 ， 我 们 可 能 必 
抛 开 一 些 前 提 。 可 能 会 以 下 面 两 种 不 同 的 方式 来 使 用 程序 中 的 类 。 
当 用 在 with 语句 之 外 时 ， ”enter () 和 exit _ () 方 法 不 会 被 执行 。 

当 用 在 with 语句 中 时 ， enter () 和 ”exit _ () 方 法 会 被 执行 。 

在 我 们 的 例子 中 ， 我 们 不 能 假设 在 _init__() 中 执行 shuffle () 方 法 是 正确 的 ， 
道 是 否 会 使 用 上 下 文 管理 器 方法 。 我 们 也 不 能 将 shuffle () 延迟 到 ”enter _() 方 法 中 
为 这 个 方法 有 可 能 不 会 被 调用 。 这 种 复杂 性 或 许 在 暗示 我 们 提供 了 过 多 的 灵活 性 。 我 们 可 
行 shuffle() 直到 第 1 次 调用 pop () 之前， 或 者 提供 一 个 子 类 可 以 禁用 的 方法 函数 。 下 
扩展 了 list 的 简单 Deck 定义 。 


class Deck( list ) : 














































































































































































































def init ( selLf，size=1 ) : 
super(). init () 
self.rng= random.Random() 
for d in range (size): 
cards = [ cardl(r,s) for r in range(13) for s in Suits |] 
super() .extend( cards ) 
self. init shuffle() 
def init shuffle( self ) : 
self.rng.shuffle( self ) 


我 们 在 Deck 中 定义 了 一 个 可 删除 的 init _snuffle () 方 法 。 当 洗 牌 完成 后 ， 子 类 可 全 


























Corator 


的 特殊 方法 。 使 用 这 个 mixin 可 以 让 定义 更 加 清晰 。 


须 重 新 设计 初始 化 方法 ， 需 要 





羽 为 不 知 
执行 ， 因 
以 延迟 执 


个 
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EE 载 这 个 方 
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法 ， 修 改 它 的 逻辑 。peck 的 子 类 可 以 在 开始 洗 牌 之 前 决定 随机 数 生成 器 的 种 子 ， 当 前 版 本 的 类 可 以 禁止 在 
创建 过 程 中 洗 牌 。 下 面 是 一 个 Deck 的 子 类 ， 它 包含 了 mixin 一 一 contextlib.ContextDecorator。 























class TestDeck( ContextDecorator, Deck ) : 





def jinit ( self, size= 1, seed= 0 ) : 
super(). init ( size=size ) 
self.seed= seed 

def init shuffle( self ) : 
Don te shutfle during -ANT 
pass 

def enter ( self ): 
self.rng.seed!( self.seed, version=1 ) 
self.rng.shuffle( self ) 
return self 

def exit ( self, exc type, exc value, traceback ) : 
pass 


子 类 通过 重 载 init_shuffle() 方 法， 禁止 在 初始 化 过 程 中 洗 牌 。 因 为 这 个 类 混入 了 
ContextDecorator, 它 也 必须 定义 _enter () 和 exit ()。 这 个 Deck 的 子 类 可 以 在 with 
上 下 文中 使 用 。 当 使 用 with 语句 时 ， 会 设 定 随 机 数 种 子 ， 并 且 会 按 一 个 已 知 的 顺序 洗 牌 。 如 果 在 
with 之 外 使 用 这 个 类 ， 就 会 使 用 当前 的 随机 数 设 置 洗 牌 ， 并 且 不 会 执行 _enter _()。 

这 种 编程 风格 的 目的 是 将 一 个 类 所 具有 的 基本 功能 与 Deck 实现 的 其 他 方面 分 离 。 我 们 已 经 将 
一 些 随机 种 子 的 处 理 从 Deck 的 其 他 方面 中 分 离 出 来 了 。 很 明显 ， 如 果 我 们 坚持 必须 使 用 上 下 文 管 
理 器 ， 就 可 以 大 幅度 简化 设计 。 这 不 是 open () 函数 传统 的 使 用 方式 。 但 是 ， 这 种 简化 是 非常 有 益 
的 。 我 们 可 以 用 下 面 的 例子 看 看 会 带 来 哪些 不 同 的 行为 。 

for i in range (3) : 


dl= Deck (5) 
print( dl.pop(), dl.pop(), dl.pop() ) 


这 个 例子 展示 了 Deck 如 何 自 己 生成 随机 的 洗 牌 顺序 。 这 是 用 Deck 洗 牌 
例子 展示 了 使 用 一 个 给 定 随机 数 种 子 的 TestDeck。 


for i in range(3): 
with TestDeck (5, seed=0) as d2: 
print( d2.pop(), d2.pop(), d2.pop() ) 
这 段 代 码 展示 了 如 何 将 Deck 的 一 个 子 类 一 一 TestDeck 用 作 上 下 文 管理 器 , 并 生成 一 系列 已 
知 顺序 的 牌 。 每 次 我 们 调用 它 ， 都 会 得 到 相同 顺序 的 牌 。 


8.3.2 ”禁用 类 的 一 个 功能 
通过 重新 定义 一 个 方法 为 只 包含 pass 的 方法 ， 我 们 关闭 了 初始 化 时 的 洗 牌 功能 。 对 于 从 一 个 
子 类 中 删除 一 个 功能 来 说 ， 这 个 过 程 显得 有 些 宛 长 。 还 有 一 个 方法 可 以 从 子 类 中 删除 功能 : 将 方法 
名 设置 为 None。 我 们 可 以 在 TestDeck 用 这 种 方式 删除 初始 化 时 的 洗 牌 操作 。 























































































































































































































































































































和 亚 
到 
或 
Im. 


为 法 5: 下 一 个 
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_init shuffle= None 


上 面 的 代码 需要 在 基 类 中 增加 一 些 代 码 用 于 兼容 方法 缺失 的 情形 ， 如 下 所 示 。 







































































try 
self. init shuffle() 
except AttributeError, TypeError: 









































pass 
这 是 从 子 类 中 删除 一 个 功能 的 方法 中 比较 显 式 的 方式 。 这 段 代码 说 明了 方法 可 能 不 存在 或 者 是 被 有 
意 地 设 为 了 None 。 然 而 另 一 种 设计 是 将 对 _init_shuffle() 的 调用 从 init () 中 移动 到 



































_enter () 方 法 中 。 这 种 方法 需要 使 用 上 下 文 管理 器 ， 它 会 让 对 象 按 我 们 预期 的 行为 工作 。 如 果 
在 文档 中 有 清楚 地 记录 ， 这 种 方法 也 不 会 带 来 困惑 。 


8.4 与 一 个 简单 的 函数 装饰 器 


一 个 decorator 函数 是 一 种 用 于 返回 新 函数 的 函数 〈 或 者 可 调用 对 象 )。 最 简单 的 只 需要 一 

个 参数 : 将 被 装饰 的 函数 。 装 饰 器 的 返回 值 是 一 个 被 包装 的 函数 。 基 本 上 ， 额 外 的 功能 会 加 到 原始 
功能 之 前 或 者 之 后 ， 这 是 函数 中 两 个 现成 的 连接 点 。 
当 定 义 一 个 装饰 器 时 ， 我 们 会 想 确保 装饰 过 的 函数 有 原始 函数 的 函数 名 和 docstring。 这 些 
将 被 用 于 写 装饰 函数 的 属性 应 该 由 装饰 器 来 设 定 。 用 functools .wraps 来 写 装饰 器 简化 了 所 需 
要 做 的 工作 ， 因 为 它 已 经 为 我 们 处 理 这 些 事情 。 
为 了 展示 两 个 可 以 插入 新 功能 的 地 方 ， 可 以 创建 一 个 调试 跟踪 装饰 器 ， 它 会 将 一 个 函数 的 参数 
和 返回 值 写 入 日 志 。 这 个 装饰 器 会 在 调用 函数 前 和 调用 函数 后 分 别 插入 新 的 功能 。 下 面 是 我 们 想 要 
封装 的 函数 一 一 some_function。 
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logging.debug( "function(", args, kw, ")" ) 
result= some function( *args, **kw ) 
logging.debug( "result = ", result ) 

return result 


段 代 码 展示 了 如 何 用 新 的 处 理 逻 辑 封 装 原来 的 函数 。 
通过 修改 基础 的 _code_ 对象 向 一 个 定义 好 的 函数 中 插入 新 功能 是 很 困难 的 。 只 有 极 少数 的 情 
况 下 ， 似 乎 真 的 有 必要 向 函数 体 中 插入 新 功能 ， 但 是 ， 通 过 将 功能 分 别 写 到 多 个 方法 函数 中 将 函数 
写成 一 个 可 调用 对 象 会 容易 很 多 。 然 后 ， 就 可 以 利用 mixin 和 子 类 而 不 用 非常 复杂 的 代码 进行 重 写 
来 完成 我 们 的 需求 。 下 面 是 一 个 会 在 函数 开始 执行 之 前 和 执行 之 后 插入 日 志 的 调试 装饰 器 。 
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def debug( function ): 
Qfunctools.wraps( function ) 
def logged function( *args, **kw ) : 
logging.debug( "%s( %r, sr )", function. name , args, kw, ) 
result= function( *args, **kw ) 
logging.debug( "%s = %r", function. name , result ) 


return result 


return logged function 
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我 们 用 了 functools .wraps 装饰 器 确保 原始 函数 的 函数 名 和 docstring 在 新 生成 的 函数 
中 都 会 被 保留 。 现 在 ， 我 们 可 以 用 装饰 器 来 生成 丰富 、 详 尽 的 调试 信息 了 。 例 如 ， 我 们 将 这 个 装饰 
器 应 用 于 一 些 函 数 上 ， 如 ackermann () ， 如 下 所 示 。 
@debug 
def ackermann( mr n ): 
if m == 0: return n+l 
elif m > 0 and n == 0: return ackermann( m-1, 1 ) 
elif m > 0 and n > 0: return ackermann( m-l1, ackermann( m, n-l1 ) ) 
段 代码 包装 了 ackermann () 函数 ， 它 用 logging 模块 将 调试 信息 写 入 到 根 记录 器 中 。 会 用 
下 面 的 方式 配置 日 志 记录 器 。 
logging.basicConfig(stream=sys.stderr, level=logging .DEBUG) 
我 们 会 在 第 14 章 “Logging 和 Warning 模块 ”中 再 回来 讲解 日 志 的 具体 内 容 。 当 执行 
ackermann (2, 4) 时 ,会 看 到 下 面 这 种 结果 。 
DEBUG:root:ackermann( (2, 4), {} ) 
DEBUG:root:ackermann( (2, 3), {} ) 
DEBUG:root:ackermann( (2, 2), {} ) 
DEBUG:root:ackermann( (0, 10), {} ) 
DEBUG:root:ackermann = 11 
DEBUG:root:ackermann = 11 
DEBUG:root:ackermann = 11 
a 
创建 独立 的 日 志 记 录 堪 
作为 对 日 志 的 优化 ， 我 们 可 能 希望 对 每 一 个 封装 的 函数 都 使 用 一 个 特定 的 日 志 记录 器 ， 而 不 是 过 





分 使 用 根 记录 器 来 记录 这 种 调试 信息 。 我 们 会 在 第 14 章 “Logging 和 Warning 模块 ”中 再 讲解 
数 创建 一 个 独立 的 日 志 记录 器 的 代码 。 





录 器 。 下 面 是 装饰 器 为 每 个 函 


def debug2( 
Qfunctools.wraps ( 


function 


a 


function 


) 




















日 志 记 





def logged function( *args, **kw ) : 
log= logging.getLogger( function. name  ) 
log.debug( "call( Sr sr )", args, kw, ) 
result= function( *args, **kw ) 
log.debug( "result %r", result ) 


return result 
return logged function 


这 个 版 本 的 输出 类 似 下 面 这 样 。 
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DEBUG:ackermann:call( (2, 4), 
DEBUG:ackermann:call( (2, 3), {} ) 
DEBUG:ackermann:call( (2, 2), 





DEBUG:ackermann:call( (0, 10), {} ) 
DEBUG:ackermann:result 11 
DEBUG:ackermann:result 11 
DI 





EBUG:ackermann:result 11 











函数 名 现在 是 日 志 记 录 器 的 名 字 。 这 个 可 以 用 来 优化 调试 信息 。 现 在 可 以 启用 针对 每 个 函数 的 日 










































































志 记 录 。 我 们 无 法 仅仅 通过 简单 地 修改 装饰 器 并 期 望 被 装饰 的 函数 也 对 应 地 更 改 。 

















我 们 需要 将 修改 后 的 装饰 器 应 用 于 函数 上 。 这 意味 























着 调试 和 测试 装饰 器 不 能 简单 地 通过 >>> 命 


才 








令 行 来 完成 。 在 修改 了 装饰 器 后 ， 必 须 重 新 加 载 函 数 。 这 可 能 包括 一 系列 的 复制 粘贴 ， 或 者 可 能 


括 重新 运行 定义 了 装 包 























8.5 市 参数 的 装饰 器 


有 时 会 希望 传递 更 复杂 的 参数 给 装饰 器 。 做 法 就 是 修改 封装 的 函数 。 当 我 们 采用 这 种 方法 时 ， 


洲 


ey 


i 变 成 了 一 个 两 步 的 参数 。 




















6 器 的 脚本 、 函 数 ， 然 后 运行 测试 或 者 演示 脚本 以 确定 一 切 都 正常 工作 。 




















下 面 的 代码 中 ， 我 们 为 一 个 函数 提供 了 一 个 带 参 的 装饰 器 。 


@decorator (arg) 
def func( ): 
pass 


上 面 装 饰 器 的 用 法 是 下 面 代码 的 一 种 简化 版 本 。 


def func( ) : 
pass 
func= decorator (arg) (func) 


两 个 例子 都 做 了 下 面 3 件 事 。 
@ 定义 了 一 个 函数 ，func。 
































@ 将 抽象 的 装饰 器 应 用 于 它 的 参数 上 ， 创 建 了 





























lL 体 的 装饰 器 ，decorator (arg) 。 


@ ”将 具体 的 装饰 器 应 用 于 函数 上 ， 创 建 了 被 装饰 版 本 的 函数 ，gdecorator (arg) (func)。 














这 意味 着 带 参 的 装饰 器 需要 间接 地 创建 最 后 的 函数 。 再 修改 调试 装饰 器 为 下 面 这 样 。 








@debug ("lo0og name") 
def some function( args ): 
pass 























这 段 代 码 让 我 们 可 以 指定 调试 日 志 所 使 用 的 名 称 。 我 们 不 使 用 根 日 志 记 录 器 ,而 是 默认 为 每 个 
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函数 提供 一 个 独立 的 记录 器 。 带 参 装饰 器 的 大 概 结构 如 下 。 








def decorator (Config) : 
def concrete decorator (function): 
Qfunctools.wraps( function ) 
def wrapped( *args, **kw ) : 
return function( *args, ** kw ) 
return wrapped 


return concrete decorator 





在 开始 介绍 实例 之 前 ， 先 看 看 带 参 装饰 器 的 内 部 细节 。 装 饰 器 的 定义 (gdef decorator 
(config) ) 规定 了 使 用 它 时 需要 提供 的 参数 。 主体 部 分 是 具体 的 装饰 器 , 它 会 作为 整个 装饰 器 的 返回 值 。 
将 被 应 用 于 函数 上 的 是 具体 的 装饰 器 (def concrete decorator (function) )。 然 后 ， 和 之 前 看 
到 的 简单 装饰 器 类 似 。 它 创建 并 返回 了 一 个 封装 好 的 函数 (def wrapped (*args, **kw) )。 下 
面 是 带 有 记录 器 名 称 的 调试 装饰 器 。 
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def debug named (log name): 
def concrete decorator (function): 
Qfunctools.wraps( function ) 
def wrapped( *args, **kw ): 
log= logging.getLogger( log name ) 
log.debug( "%s( %r, sr )", function. name , args, kw, ) 
result= function( *args, **kw ) 
log.debug( "%s = %r", function. name , result ) 
return result 
return wrapped 


return concrete decorator 



































沼 








Ne 


数 。 当 它 被 应 用 于 函数 上 时 ,具体 的 装饰 器 会 返回 一 个 封装 好 的 函数 。 当 函数 以 下 面 的 方式 使 用 时 ， 
器 会 添加 许多 调试 信息 。 它 们 直接 输出 到 名 为 recursion 的 日 志 中 ， 如 下 所 示 。 


Qdqebug named ("recursion") 


decorator 函数 接受 一 个 参数 ， 即 要 使 用 的 日 志 名 称 。 它 创建 并 返回 了 一 个 具体 的 装饰 器 函 






























































def ackermann( m, n ) : 
if m == 0: return n+l 
elif m > 0 and n == 0: return ackermann( m-1, 1 ) 


elif m > 0 and n > 0: return ackermann( m-1, ackermann( m, n-l1 ) ) 


8.6 创建 方法 函数 装饰 器 




















一 个 类 中 方法 函数 的 装饰 器 和 一 个 单独 的 函数 的 装饰 器 是 一 样 的 ， 只 是 在 不 同 的 上 下 文中 使 
用 。 这 种 上 下 文 所 带 来 的 一 个 轻微 的 后 果 是 必须 经 常 显 式 地 声明 self 变量 

方法 函数 装饰 器 的 一 个 应 用 是 追踪 对 象 状态 的 改变 。 商 业 应 用 程序 经 常会 创建 有 状态 的 记录 ; 
通常 ， 这 些 记录 会 作为 关系 型 数据 库 中 的 行 。 我 们 会 在 第 9 章 “ 序 列 化 和 保存 一 一 JSON、YAML、 


Pickle、CSV 和 XML”、 第 10 章 “ 用 Shelve 保存 和 获取 对 象 ” 和 第 11 章 “ 用 SQLite 保存 和 获取 对 
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城 














象 ” 中 详细 讲解 对 象 的 表示 。 

















当 我 们 有 一 些 有 状态 的 记录 时 ， 状 态 的 改变 应 该 是 可 以 被 追踪 的 。 
通过 追踪 可 以 确认 改变 已 经 被 保存 到 记录 中 。 为 了 能 够 追踪 这 些 记 
录 ， 必 须 可 以 用 某 种 方式 来 获得 每 条 记录 在 改变 之 前 和 改变 之 后 的 
版 本 。 状 态 数据 库 记录 是 一 种 长 期 使 用 的 传统 方法 ， 但 是 不 是 任何 
情况 下 都 必需 的 。 不 可 变 的 数据 库 记录 是 另外 一 种 可 选择 的 设计 。 




















四 











当 设 计 一 个 有 状态 的 类 时 ， 任 何 setter 方法 都 会 带 来 状态 的 改变 。 这 些 setter 方法 通常 会 用 
@property 装饰 器 ， 这 样 它们 就 可 以 被 当 作 简单 的 属性 来 使 用 。 如 果 我 们 这 么 做 ， 我 们 可 以 添加 一 个 
@audit 装饰 器 ， 这 样 就 能 合理 地 追踪 所 有 的 改变 。 我 们 会 通过 logging 模块 创建 追踪 日 志 。 我 们 会 
用 _repr () 方 法 函数 生成 一 个 可 以 用 来 浏览 所 有 修改 的 完整 文本 ， 下 面 是 一 个 追踪 装饰 器 。 

























































































def audit( method ) : 
Qfunctools.wraps (method) 
def wrapper( self, *args, **kw ) : 
audit log= logging.getLogger( 'audit"' ) 
before= repr (self) 
try: 
result= method( self, *args, **kw ) 
after= repr (self) 
except Exception as e: 
audit log.exception( 
'%$s before %s\n after %$s', method. qualname , before, after ) 
raise 
audit log.infol( 
'%$s before Ss\n after %$s', method. qualname , before, after ) 
return result 


return wrapper 
我 们 创建 了 一 个 对 象 被 修改 前 的 文本 表示 。 然 后 ， 调 用 原始 的 方法 函数 。 如 果 有 异 弟 ， 会 生成 一 
个 包含 异常 信息 的 追踪 日 志 。 否则 ,会 在 日 志 中 生成 一 个 INFO 条 目 ， 它 包含 方法 的 全 名 、 修 改 前 的 文 
本 表示 和 修改 后 的 文本 表示 。 下 面 是 一 个 修改 过 的 Hanq 类 ， 它 会 向 我 们 展示 要 如 何 使 用 这 个 装饰 器 。 































































































class Hand: 


def init ( self, *cards ) : 
self. cards = list (cards) 
Qaudit 


def iadd ( self, card ) : 
self. cards.append( card ) 
return self 





def ~ reépr (Serf 2 
cards= ", ".join( mapl(str,self. cards) ) 
return "{ class . name }({cards})".format( | 





Class =self. class , Ccards=cards) 
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这 个 定义 修改 了 _iadd () 方 法 函数 ， 这 样 添加 一 张 牧 就 成 为 一 个 可 追踪 的 事件 。 这 个 装饰 
器 会 执行 追踪 操作 ， 在 进行 操作 前 和 完成 操作 后 会 保存 Hand 的 文本 表示 。 

方法 装饰 器 的 这 种 使 用 方式 相当 于 对 某 个 方法 函数 进行 正式 声明 ， 这 样 会 大 量 地 修改 状态 。 我 
们 可 以 直接 使 用 代码 审查 ， 确 保 所 有 符合 要 求 的 方法 函数 都 像 这 个 一 样 ， 被 标记 为 是 可 追踪 的 。 有 
一 个 没有 解决 的 问题 是 追踪 对 象 的 创建 过 程 。 目 前 尚 不 清楚 是 否 需要 追踪 对 象 的 创建 过 程 。 有 一 些 

会 说 对 象 的 创建 并 不 是 一 种 状态 改变 。 

在 我 们 想 要 追踪 对 象 创建 的 情境 中 , 我 们 不 可 以 在 ”init _() 方 法 函数 中 使 用 这 个 audit 装 
饰 器 。 因 为 在 执行 _init _() 之 前 什么 都 没有 。 我 们 可 以 通过 以 下 两 种 方式 补救 这 个 问题 。 

@ 可 以 添加 一 个 _new _() 方 法 用 于 确保 一 个 空 的 _cards 属性 会 以 空 集合 的 方法 存在 于 类 中 。 

@ 可 以 修改 audit () 装饰 器 ， 当 init __() 被 执行 时 ， 接 受 程序 抛 出 的 AttributeError 

异常 。 
第 2 种 方式 相对 来 说 更 加 灵活 一 些 ， 我 们 可 以 像 下 面 这 样 做 。 





try: 


before= repr (self) 


except Attribute 





Error as e: 


before= repr (e) 


这 段 代 码 会 记录 类 似 Attributel 





这 样 的 信息 作为 初始 化 前 的 状态 。 


8.7 创建 类 装饰 器 






















































































Error: 'Hand' object has no attribute ' cards' 












































































































































和 装饰 一 个 函数 类 似 , 也 可 以 写 一 个 类 装饰 器 , 用 来 向 类 中 添加 功能 。 基本 的 原则 都 是 一 致 的 。 
装饰 器 是 一 个 函数 (或 者 一 个 可 调用 对 象 )。 它 接受 一 个 类 作为 参数 ， 返 回 一 个 类 作为 返回 值 。 

在 类 定义 中 ， 我 们 的 切入 点 很 有 限 。 大 多 数 情况 下 ， 类 装饰 器 会 将 额外 的 功能 包 襄 进 类 中 。 从 
技术 上 来 说 ， 创 建 一 个 封装 了 原始 类 的 类 是 可 以 的 。 但 这 种 做 法 有 一 定 的 难度 ， 因 为 包装 类 本 身 必 
须 是 非常 通用 的 。 也 可 以 创建 一 个 被 装饰 类 的 子 类 。 但 是 这 样 的 做 法 可 能 会 导致 装饰 器 的 使 用 者 非 
常 困惑 。 另 外 一 种 最 糟糕 的 做 法 就 是 从 类 中 删除 一 些 功 能 。 

前 面 展 示 了 一 个 很 复杂 的 类 装饰 器 。Eunctools .Total_ordqering 装饰 器 向 类 中 注入 一 
系列 新 的 方法 函数 。 这 种 实现 方法 用 的 技术 是 创建 lambda 对 象 并 且 将 它们 赋值 给 类 的 属性 。 











接 | 





来， 我 们 会 介绍 一 些 相 对 简单 的 装饰 
能 会 有 一 个 小 问题 。 通常 , 我 们 希望 每 个 类 都 有 自己 的 































































































class UglyClass!l: 


def init ( 


self ) : 


器。 在 调试 和 记录 日 
日 志 记 录 器 。 我 们 经 常 被 强制 要 求 像 下 


志 时 ， 创 建 针 对 类 的 日 志 记录 器 可 


看 这 样 做 。 


























self.logger= logging.getLogger(self. class . dualname ) 


self.logger.infol( 


def method ( 


self.logger.infol( 


"New thing" ) 
人 


"method %r", args 


self, *args 


) 
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这 个 类 的 缺点 是 它 创建 了 一 个 对 象 ， 它 不 属于 类 操作 的 一 部 分 却 是 类 的 一 个 独立 方面 
logger 实例 。 我 们 不 希望 用 这 种 额外 的 方面 污染 我 们 的 类 。 但 是 这 并 不 是 问题 的 全 部 。 虽 然 
logging.getLogger () 非常 高 效 ， 但 是 并 非 完全 没有 代价 。 我 们 希望 每 次 创建 Uglyclassl 实 
例 时 ， 可 以 避免 这 种 额外 的 消耗 。 

下 面 是 一 个 稍微 好 一 些 的 版 本 。 我们 将 1ogger 从 类 中 每 个 独立 的 对 象 中 分 离 出 来 , 把 它 变 成 
了 一 个 类 级 的 实例 变量 。 


















































党 下 
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class UglyClass2: 
logger= logging.getLogger ("UglyClass2") 
def init ( self ): 
self.logger.info( "New thing" ) 
def method!( self, *args ) : 


self.logger.info( "method gr", args ) 











这 个 类 的 优点 是 它 只 调用 了 logging .getLogger() 一 次 。 但 是 ， 它 有 严重 的 DRY 问题 
在 定义 中 ， 没 有 办 法 自动 设置 类 名 。 
小 装饰 器 来 解决 DRY 问题 。 
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E 题 
于 类 还 没有 被 创建 ， 因 此 必须 重复 类 名 。 可 以 用 下 面 的 这 个 






























































def logged( class ): 


class .logger= logging.getLogger( class . qqgualname  ) 
return class_ 











这 个 装饰 器 修改 了 类 的 定义 ， 它 添加 了 logger 引用 作为 类 级 属性 。 现 在 ， 每 个 方法 都 能 
self .logger 来 生成 追踪 或 者 调试 信息 。 当 我 们 想 要 使 用 这 个 功能 时 ， 可 以 在 类 上 应 用 @logged 装 
饰 器 。 下 面 的 Someclass 是 一 个 使 用 了 @1logged 装饰 器 的 例子 。 
























































Qlogged 
class SomeClass : 
def _ init ( self ) : 
self.logger.info( "New thing" ) 
def method( self, *args ) : 


self.logger.info( "method %r", args ) 




















现在 ， 我 们 类 中 包含 了 一 个 每 个 方法 都 可 以 使 用 的 logger 属性 。 logger 的 值 不 是 对 象 的 一 
个 功能 ， 这 样 就 保证 了 这 个 方面 和 类 的 其 他 方面 是 分 离 的 。 这 个 属性 还 有 一 个 额外 的 好 处 就 是 ， 它 在 
导入 模块 时 创建 了 logger 实例 ， 减 少 了 一 些 日 志 记 录 的 开销 。 可 以 将 这 个 类 与 Uglyclass1 进行 
比较 ， 后 者 在 每 次 创建 实例 时 都 会 调用 logging.getLogger ()。 


8.8 向 类 中 添加 方法 函数 







































































类 装饰 器 通过 两 个 步 又 来 创建 新 方法 函数 : 先 创 建 方法 函数 ， 然 后 将 它 插 入 到 类 中 。 通 常用 
mixin 类 比 用 装饰 器 更 好 。 一 个 mixin 类 的 正确 用 途 是 用 于 插入 方法 。 插 入 方法 的 另外 一 种 方式 更 
不 易于 理解 ， 甚 至 可 能 会 让 人 觉得 惊讶 。 
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在 Total_ordering 装饰 器 的 例子 中 ， 有 具体 插入 什么 方法 是 非常 灵活 的 ， 它 基于 类 中 已 经 提 
供 了 什么 。 这 是 典型 用 法 中 的 一 种 特殊 情况 ， 但 是 非常 明智 。 

我 们 可 能 想 要 定义 一 个 标准 的 memento () 方法 。 我 们 希望 把 这 个 标准 的 方法 包含 在 多 个 不 同 
的 类 中 。 我 们 会 对 比 这 个 设计 的 装饰 和 mixin 类 的 版 本 。 下 面 是 用 添加 一 个 标准 方法 的 装饰 器 实现 
版 本 。 


def memento( class ) : 








































































































def memento( self ) : 
return "{0. class .qualname }({0!r})".format (self) 
class .memento= memento 


return class_ 






































这 个 装饰 器 包含 了 一 个 即将 被 插入 到 类 中 的 方法 函数 。 下 面 演示 了 如 何 使 用 这 个 amemento 装饰 器 
向 类 中 添加 方法 函数 。 














QQmemento 





class SomeClass: 
def init ( self, value ): 
self.value= value 
def. -rep (“Selt ): 
return "“{0.value}".format (self) 











装饰 器 向 类 中 插入 了 一 个 新 方法 一 一 nemento () 。 但 是 ， 这 种 做 法 有 一 些 缺 点 。 

@ 我 们 不 能 通过 重 载 memento () 方 法 函数 的 实现 来 处 理 特殊 情况 ， 它 是 在 定义 之 后 内 屋 到 
类 中 的 。 

@ ”我 们 很 难 扩展 装饰 器 函数 。 如 果 我 们 想 要 扩展 功能 或 者 处 理 特殊 情况 ， 我 们 必须 将 它 升级 
为 可 调用 对 象 。 我们 准备 升级 到 一 个 可 调用 对 象 ， 那 么 我 们 应 该 完全 放弃 这 种 方法 ， 转 而 
使 用 一 个 mixin 类 添加 方法 。 

下 面 是 添加 一 个 标准 方法 的 mixin 类 。 











































































































































































































class Memento : 
def memento( self ) : 
return "{0. class .qualname }({0!r})".format (self) 














下 面 演 示 了 如 何 使 用 这 个 Memento 类 定义 一 个 类 。 





class SomeClass2( Memento ): 
def jinit ( self, value ): 
self.value= value 
def.. Tepr (SELES 
return "{0.value}".format (self) 





这 个 mixin 提供 了 一 个 新 方法 一 一 memento () ， 这 是 一 个 mixin 类 的 经 典 用 法 。 通 过 扩展 
Memento mixin 类 添加 功能 更 容易 。 另 外 ,我 们 可 以 重 载 mementeo () 方法 函数 ， 用 于 处 理 特殊 
情况 。 
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8.9 ”将 装饰 器 用 于 安全 性 


软件 中 总 是 充满 了 需要 提供 一 致 实现 的 横 切 关注 点 和 方面 ， 即 使 它们 属于 不 同 的 类 层次 结构 。 
试图 将 类 层次 结构 强加 于 一 个 横 切 关注 点 是 一 种 常见 错误 。 我们 已 经 看 了 一 些 这 样 的 例子 ,例如 日 
志和 审计 。 
强制 每 个 需要 写 日 志 的 类 都 从 一 些 1oggable 的 基 类 继承 是 不 合理 的 。 我 们 可 以 设计 一 个 
loggable 的 mixin 或 者 一 个 loggable 的 装饰 器 。 这 并 不 会 影响 我 们 需要 设计 出 一 种 能 够 让 多 态 
正常 工作 的 正确 的 继承 结构 。 
些 和 安全 性 相关 的 横 切 关注 点 。 在 一 个 Web 应 用 程序 中 ， 有 两 个 方面 的 安全 问题 需要 考虑 。 
@ 验证: 我 们 知道 是 谁 发 起 的 请 求 吗 ? 
@ 授权 : 通过 验证 的 用 户 是 否 有 权限 发 起 请 求 ? 
一 些 Web 框架 允许 我 们 根据 对 于 安全 性 的 需求 装饰 我 们 的 请 求 处 理 器 。 例 如 ，Django 框架 包 
含 了 许多 装饰 器 ， 它 们 允许 我 们 为 一 个 视图 函数 或 者 一 个 视图 类 指定 安全 要 求 。 下 面 是 其 中 的 一 些 
装饰 器 。 
@ user passes test: 这 是 一 个 底层 的 通用 装饰 器 ， 并 且 被 用 于 创建 另外 两 个 装饰 器 。 
它 需 要 一 个 测试 函数 ， 请 求 关联 的 已 登录 的 User 对 象 必须 通过 这 个 给 定 函数 来 进行 测试 。 
如 果 User 实例 无 法 通过 这 个 测试 ， 它 们 会 被 重 定向 到 一 个 登录 页 面 ， 这 样 用 户 就 可 以 提 
供 能 够 发 起 请 求 的 凭据 。 
@ login required: 这 个 装饰 器 基于 user passses test。 它 用 于 确保 已 登录 的 用 户 
是 通过 验证 的 。 这 种 类 型 的 装饰 器 会 应 用 在 所 有 访问 者 的 请 求 上 。 例 如 ， 像 更 改 密码 或 者 
登 出 这 种 请 求 ， 就 不 应 该 需要 任何 特殊 的 许可 。 
@ permission required: 这 个 装饰 器 与 Django 内 置 的 数据 库 权 限 系统 配合 使 用 。 它 用 
来 确认 已 登录 的 用 户 《 或 者 用 户 组 ) 拥有 某 种 特定 的 许可 。 这 种 类 型 的 装饰 器 用 于 处 理 需 
要 特定 管理 权限 的 请 求 。 
其 他 的 包 和 框架 中 也 有 表达 这 种 Web 应 用 程序 中 横 切 方面 的 方法 。 在 许多 情况 下 ，Web 应 用 程 
序 甚至 有 更 严格 的 安全 性 要 求 。 我 们 可 以 考虑 设计 一 个 能 够 根据 合约 条 例 有 选择 性 地 完成 解锁 功能 
的 Web 应 用 程序 ， 但 必须 设计 一 个 下 面 这 样 的 测试 。 






































































































































































































































































































































































































































































































































































































































































































































def user has _ feature( feature _ name ) : 
def has feature( user ) : 
return feature name in (f.name for f in user.feature set()) 


return user passes test( has feature ) 
我 们 定义 了 一 个 函数 , 用 于 检测 登录 用 户 的 feature_set 集合 确定 某 个 功能 是 否 和 当前 的 用 
户 相 关 。 我 们 在 has_feature () 函数 中 用 Django 的 uesr_passes _test 装饰 器 创建 了 一 个 可 以 
被 应 用 于 相关 的 view 函数 的 新 装饰 器 。 然 后 ， 我 们 可 以 像 下 面 这 样 创建 一 个 view 函数 。 
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Quser has feature( 'special bonus' ) 
def bonus _ view( request ) : 
Pass 


这 确保 了 安全 性 关注 点 会 一 致 地 应 用 于 多 个 不 同 的 view 函数 。 





8.10 总 结 








我 们 介绍 了 如 何 使 用 装饰 器 修改 函数 和 类 的 定义 。 也 介绍 了 如 何 将 一 个 庞大 的 类 分 解 成 互相 关 
联 的 模块 的 mixin。 

这 所 有 的 技术 都 是 为 了 分 离 业务 相关 的 功能 和 通用 的 功能 ， 例 如 安全 、 审 计 或 者 日 志 。 我 们 会 
区 分 继承 自 类 的 功能 和 不 属于 继承 的 额外 关注 点 的 方面 。 继 承 的 功能 是 显 式 设计 的 一 部 分 。 它 们 是 
继承 结构 中 的 一 部 分 ， 它 们 定义 了 一 个 对 象 是 什么 。 其 他 的 方面 可 以 是 mixin 或 者 装饰 ， 它 们 定义 
了 一 个 对 象 是 如 何 工作 的 。 


8.10.1 设计 要 素 和 折 中 方案 


在 大 多 数 情 况 下 ，is-a 和 acts-as 的 区 别 很 清楚 。 继 承 的 功能 是 全 局 问题 域 的 一 部 分 。 当 讨论 模 
拟 21 点 时 ， 例 如 牌 、 手 、 下 注 、 加 牌 和 叫 停 很 明显 是 问题 域 的 一 部 分 。 类 似 地 ， 数 据 的 收集 和 对 
结果 的 统计 分 析 是 解决 方案 的 一 部 分 。 其 他 的 东西 , 例如 日 志 、 调试 和 审计 并 不 是 问题 域 的 一 部 分 ， 
而 是 和 解决 方案 所 用 的 技术 有 关 。 
尽管 大 多 数 情况 这 些 东西 非常 清晰 ， 但 是 继承 和 装饰 方面 之 间 的 分 别 有 可 能 不 是 很 清楚 。 在 一 
些 情况 下 ， 它 可 能 会 由 一 种 审美 判断 决定 。 通 常 ， 当 创建 与 特定 问题 无 关 的 框架 和 基础 架构 类 时 ， 
做 这 种 决定 会 变 得 很 难 ， 通 用 的 策略 如 下 。 

@ 首先， 问题 的 核心 方面 会 需要 类 的 定义 。 许 多 类 都 是 继承 自 特定 的 问题 ， 然 后 组 成 可 以 让 

多 态 按 我 们 预期 的 方式 进行 工作 的 类 结构 。 

@ 其次， 一 些 方面 会 需要 定义 mixin 类 。 当 有 一 些 多 维 的 方面 时 ， 这 件 事 常 会 发 生 。 对 于 一 
种 设计 ， 可 能 有 独立 的 坐标 或 者 维度 。 每 个 维度 都 是 多 态 的 一 种 选择 。 当 介绍 21 点 时 ， 
有 两 种 策略 : 打牌 策略 和 下 注 策 略 。 这 两 个 策略 是 独立 的 ， 或 许 也 可 以 看 作 是 一 种 全 局 玩 

家 设计 的 mixin 元 素 。 

当 定义 独立 的 mixin 时 ， 可 以 有 独立 的 继承 结构 。 对 于 21 点 的 策略 ， 可 以 定义 一 个 和 打牌 策 
略 无 关 的 多 态 结构 。 然 后 ， 我 们 可 以 定义 同时 拥有 两 种 结构 中 mixin 元 素 的 玩家 。 

方法 通常 从 类 定义 中 创建 。 它 们 是 主 类 或 者 mixin 类 的 一 部 分 。 正 如 之 前 所 介绍 的 ， 我 们 有 3 
种 设计 策略 : 封装 、 扩 展 和 创造 。 我 们 可 以 通过 用 一 个 类 “封装 ” 另 一 个 类 引入 新 的 功能 。 在 一 些 
情况 下 ， 我 们 会 发 现 我 们 被 强制 要 求 暴露 一 些 只 是 简单 地 委托 给 底层 类 的 方法 。 当 我 们 使 用 了 太 多 
的 委托 之 后 ,边界 就 会 变 得 模糊 ; 一 个 装饰 器 或 者 mixin 可 能 是 更 好 的 选择 。 在 一 些 其 他 的 情况 下 ， 
封装 一 个 类 可 能 比 引 入 一 个 mixin 类 更 加 清楚 。 


与 问题 正 交 的 方面 经 常 可 以 用 装饰 器 解决 。 装 饰 器 可 以 被 用 于 引入 不 属于 is-a 关系 的 功能 。 
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8.10.2 ”展望 
下 面 的 章节 会 关注 一 些 不 同 的 内 容 。 我 们 已 经 介绍 了 几乎 所 有 Python 内 置 的 特殊 方法 。 下 面 的 
5 章 内 容 会 专注 于 对 象 的 持久 化 和 序列 化 。 我 们 会 以 不 同 的 外 部 标记 法 为 开始 介绍 对 象 的 序列 化 和 
保存 ， 包 括 JSON、YAML、Pickle、CSV 和 XML 。 

序列 化 和 持久 化 会 带 来 更 面向 对 象 的 类 设计 方法 。 我 们 会 介绍 对 象 关 系 以 及 它们 是 如 何 表 万 
的 。 我 们 也 会 介绍 序列 化 和 反 序 列 化 对 象 带 来 的 开销 以 及 不 被 信任 的 源 反 序列 化 对 象 带 来 的 安全 


问题 。 
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第 2 部 分 





持久 化 和 序列 化 


序列 化 和 保存 一 一 JSON、YAML、Pickle、CSV 和 XML 


用 Shelve 保存 和 获取 对 象 





用 SQLite 保存 和 获取 对 象 





传输 和 共享 对 象 


配置 文件 和 持久 化 


持久 化 和 序列 化 所 谓 对 象 持久 化 的 过 程 ， 就 是 把 对 象 写 入 某 个 存储 机 制 。 对 象 可 以 从 存储 机 制 
中 取出 并 在 Python 应 用 中 使 用 。 对 象 可 以 使 用 JSON 形式 来 表示 并 写 入 文件 系统 中 , 或 者 是 被 对 象 
关系 映射 (Object Relational Mapping，ORM) 层 用 于 表达 SQL 数据 表 中 的 行 ， 将 对 象 存 入 数据 库 。 
对 象 序列 化 有 两 个 目的 。 序列 化 是 为 了 能 够 将 对 象 存 入 本 地 文件 系统 。 男 外 ， 有 时 在 进行 进程 
或 应 用 通信 时 ， 也 需要 将 对 象 进行 序列 化 。 然 而 所 关注 的 点 是 不 同 的 ， 一 般 持 久 化 包含 了 序列 化 。 
因此 ， 一 种 优秀 的 持久 化 技术 也 会 支持 数据 交换 的 场景 。 我 们 会 介绍 几 种 Python 用 来 序列 化 和 持 
久 化 的 方式 ， 主 要 涉及 以 下 各 章 。 
e 第 9 章 “ 序 列 化 和 保存 一 JSON、YAML、Pickle、CSV 和 XML” 介 绍 了 如 何 使 用 类 库 
进行 简单 的 持久 化 操作 ， 包 括 这 些 数据 格式 : JSON、YAML、Pickle、XML 和 CSV。 它 
们 都 是 Python 中 比较 普遍 使 用 的 格式 ， 也 比较 适合 用 于 数据 交换 ， 主 要 应 用 于 单一 对 象 
而 非 多 个 对 象 的 场景 。 
e。 第 10 章 “用 Shelve 保存 和 获取 对 象 ” 介 绍 了 如 何 使 用 Python 中 的 Shelve 模块 来 进行 基 
本 的 数据 库 操 作 ， 可 用 于 完成 Python 对 象 的 存储 并 支持 多 个 对 象 的 持久 化 。 
。 第 11 章 “用 SQLite 保存 和 获取 对 象 ” 中 介绍 了 如 何 使 用 SQL 来 进行 有 关 关 系数 据 库 更 复 
杂 的 操作 。 由 于 SQL 与 面向 对 象 不 能 直接 匹配 ， 于 是 就 产生 了 阻抗 不 匹配 问题 。 常 见 的 
解决 方案 是 使 用 对 象 关系 映射 来 完成 对 象 的 存储 。 
e@ ”对 于 网 站 应 用 ， 通 常会 使 用 表征 性 状态 传输 (Representation State Transfer，REST)。 在 第 12 章 
“传输 和 共享 对 象 ” 中 将 介绍 如 何 使 用 HTTP 协议 和 JSON、YAML 以 及 XML 格式 来 传输 对 象 。 
。 最后， 在 第 13 章 “ 配 置 文件 和 持久 化 ”中 会 介绍 几 种 Python 应 用 操作 配置 文件 的 方式 。 
可 以 使 用 不 同 的 数据 格式 ， 但 各 有 优 缺 点 。 配 置 文件 其 实 就 是 一 个 可 被 直接 编辑 的 、 持 久 
化 对 象 的 集合 。 
这 部 分 的 重点 是 在 更 高 层面 实现 抽象 的 设计 模式 , 我 们 称 之 为 架构 模式 。 因 为 它们 用 于 表达 应 
用 的 整体 结构 ， 将 系统 分 为 了 不 同 的 层 。 我 们 的 关注 点 是 将 系统 划分 为 不 同 的 部 分 ， 这 个 原则 称 为 
“关注 点 分 离 ”。 例 如 ， 我 们 需要 把 持久 化 、 核 心 逻辑 以 及 数据 表示 层 分 离 。 熟 练 掌 握 面 向 对 象 设 
计 意 味 着 需要 站 在 更 高 的 层面 针对 系统 架构 进行 思考 。 























































































































































































































































































































































































































































































































































































































为 了 存储 Python ! 
序列 化 ， 又 叫 作 数 据 转 
几 种 将 一 个 




















的 对 象 ， 必 须 











第 9 章 
序列 化 和 保存 一 一 JSON、YAML、 
Pickle、CSV 和 XML 








E 将 其 转换 为 字 节 ， 然 后 再 
换 (marshaling)、 压 缩 (deflating) 或 编码 〈encoding)。 接 下 来 我 们 会 介绍 














每 种 序列 化 方式 又 称 为 物理 





所 i 








由 最 好 的 格式 。 我 们 需要 和 











使 | 








然而 这 个 单 


方式， 而 并 未 改变 对 象 的 
比较 重要 的 一 点 是 (尤其 是 CSV 格式 )， 这 

















的 对 象 可 以 是 一 


























， 只 是 对 字 节 流 

















组 对 象 的 集合 ， 范 轩 


区 分 开 
的 操作 。 


ython 对 象 转换 为 字符 串 或 字 节 流 的 方式 。 
数据 格式 ， 每 利 
逻辑 数据 格式 
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格式 各 有 优 缺 点 。 对 于 
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将 字 节 写 入 文件 。 
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简单 地 将 字 节 流 重新 排列 或 改变 空格 
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集合 进 
理 多 个 对 象 的 序列 化 ， 
和 第 12 章 “ 传 输 和 
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为 这 些 方式 ! 














多 的 控制 。 当 需要 处 再 
这 时 ， 就 需要 移 至 更 大 





行 反 序 列 化 , 完成 增 量 序列 化 需要 额 儿 
10 章 “ 用 Shelve 保存 和 获取 对 象 入 第 11 



























































一 部 分 ， 
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EE 大量 不 同 的 项 时 ， 
的 数据 库 、 服 务 器 或 消息 队列 ! 
JavaScript Object Notation (JSON): 这 是 一 种 
见 : http://www.json.org。json 模块 提供 了 用 
于 json 格式 操作 。 在 Python 标准 
节 “ 存 储 ” 与 一 般 的 Python 对 象 的 存储 问题 相 E 
YAML 不 是 标记 语言 (YAML): 它 是 JSON 的 一 种 扩展 ， 而 
息 可 参见 : http://yaml.org。 它 3 
供 了 很 多 Python 的 存储 
pickle: pickle 模块 内 置 有 Python 特殊 的 数据 表示 方式 。 
此 我 们 会 详细 地 介绍 女 














并 不 








的 工 


t 享 对 象 ”会 介绍 更 好 的 方式 来 处 
的 每 一 个 都 是 针对 单一 的 对 象 ， 所 以 我 们 无 法 在 对 象 集合 的 内 存 


能 一 次 性 把 它们 加 载 到 内 存 , 我 们 无 法 直接 使 


表达 方式 只 是 在 表达 一 个 单一 








的 Python 对 象 























定 的 。 为 了 处 理 这 些 对 象 : 
作 量 。 不 必 下 太 多 工夫 在 如 何 使 / 
章 “ 用 SQLite 保存 条 
理 多 个 不 同 的 对 象 。 


























不 同 格式 
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o 








被 广泛 使 用 的 表示 方式 。 更 多 























加 载 和 转 储 数据 所 需要 的 类 与 函数 ， 都 是 


























库 























功能 。 























， 可 以 看 一 下 第 19 节 “ 网 络 数据 处 理 
上 ，json 模块 更 侧重 于 JSON 的 表达 方式 。 


非 Python 库 的 一 部 分 ; 必须 引 } 














”， 而 不 是 第 




















这 个 过 程 称 为 


呈现 对 象 的 方式 而 言 ， 没 有 


的 


o 


的 一 个 ， 必 须 对 


处 


0 获取 对 象 " 


大 


j 这 些 技术 。 
现在 我 们 来 了 解 如 下 几 种 序列 化 的 表示 方式 。 
信息 可 以 参 


天 
12 






































可 以 简化 序列 化 结果 。 






































于 它 是 Python 库 中 很 重要 





























1D 何 使 用 





这 利 





方式 来 序列 化 对 象 。 而 当 与 非 Python 程 








时 


外 部 的 模块 。 在 PyYaml 


的 
序 
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交互 数据 时 ， 这 并 非 一 个 恰当 的 做 法 。 在 第 10 章 “ 用 Shelve 保存 和 获取 对 象 ” 中 ， 它 是 
shelve 模块 的 基础 ， 同 样 地 ， 在 第 12 章 “ 传 输 和 共享 对 象 ” 中 ， 对 象 的 共享 和 转换 中 
的 消息 对 象 也 是 基于 它 实 现 的 。 
@ Comma-Separated Values (CSV) 模块 :在 表达 复杂 的 Python 对 象 时 ， 这 种 格式 显得 不 
够 方便 。 由 于 它 的 使 用 很 普遍 ， 因 此 需要 找到 将 Python 对 象 序列 化 为 CSV 的 方案 。 可 以 


参考 Python 标准 库 中 的 第 14 节 “ 文 件 格 式 ”， 而 非 第 12 节 “ 存 储 ” 因为 它 是 一 种 简单 
的 文件 格式 ， 或 者 稍微 复杂 一 些 。 使 用 
下 进行 Python 对 象 集合 的 增 量 表示 。 

@ XML: 虽然 有 一 些 缺 陷 ， 但 它 很 常用 ， 































































































习 

















们 会 


中 反 序 列 





























重点 关注 ElementTree。 








除了 以 上 











纺 蜡 伟 























据 表 。 这 意味 着 存在 两 个 子 问题 ， 


民 
需要 使 用 更 复杂 
第 

































































CSYV 格式 ， 可 以 在 不 必 一 次 性 加 载 到 内 存 的 前 提 











寻 此 将 对 象 转换 为 XML 格式 ， 以 及 从 XML 文件 




















化 至 对 象 是 很 重要 的 操作 。 而 XML 解析 这 个 主题 太 大 ， 可 参见 Python 标准 库 中 的 
第 20 节 “ 结 构 化 标记 处 理工 具 ”。 有 很 多 模块 可 用 来 解析 XML， 但 每 种 各 有 优 缺 点 ， 我 



























































几 L 种 简单 的 分 类 ， 还 会 遇 到 混合 使 用 的 情形 。 一 个 例子 是 以 XML 格式 编码 的 电子 数 
一 个 是 行列 数据 的 表示 ， 另 一 个 是 XML 解析 的 问题 。 这 导致 了 
的 软件 来 将 不 同 数 据 格式 转换 为 类 似 CSV 的 行 ， 用 于 完成 Python 对 象 的 转换 。 在 





















































12 章 “ 传 输 和 共享 对 象 ” 和 第 13 章 “ 配 置 文件 和 持久 化 ”中 会 再 次 对 这 类 主题 进行 回顾 ， 如 何 

















使 用 RESTful 




















的 Web 服务 和 序列 化 对 象 ， 以 及 配置 文件 和 可 编辑 的 序列 化 对 象 。 





9.1 持久 化 、 类 、 状 态 以 及 数据 表示 


Python 对 
没有 那么 长 ， 












































象 主要 保存 在 计算 机 内 存 中 ， 它 们 的 生命 周期 就 是 Python 进程 。 它 们 的 生命 周期 甚至 
电 许 只 是 与 它们 在 命名 空间 中 的 引用 长 短 一 致 。 如 果 希 望 一 个 对 象 的 生命 周期 超过 




















Python 进程 或 
大 部 分 操 


他 稳定 的 存储 形式 。 这 只 是 将 字 节 从 内 存 中 取 








当 内 存 ， 











命名 空间 ， 我 们 需要 将 它 持久 化 。 
芷 系统 以 文件 系统 的 方式 来 提供 持久 化 存储 服务 。 这 通常 包括 磁盘 驱动 器 、 内 存 或 其 
HH 并存 入 磁盘 文件 的 方式 。 























































































































的 Python 对 象 引用 了 其 他 对 象 时 ， 复 杂 度 就 增加 了 。 一 个 对 象 引 用 了 它 自 身 的 类 ， 








这 个 类 好 





i 




















内 存 中 的 版 本 就 是 包含 一 系列 引用 的 关系 网 络 。 












































了 它 的 元 类 和 其 他 基本 类 。 这 个 对 象 可 以 是 一 个 容器 并 且 引 用 了 其 他 对 象 。 这 个 对 象 在 















































对 为 内 存 寻 址 是 不 固定 的 ， 如 果 没 有 将 地 址 重 写 为 


















































独立 于 寻 址 方式 的 键 值 就 试图 从 内 存 取出 字 节 ， 这 将 破坏 所 保存 的 引用 关系 。 所 保存 的 引用 关系 大 
部 分 是 静态 的 一 一 例如 类 定义 ， 相 比 于 变量 来 说 ， 变 化 非常 少 。 理 想 情 况 下 ， 一 个 类 定义 是 不 会 改 


型 迁移 问题 ， 用 于 管理 数据 模型 (或 类 ) 的 变化 。 















































变 的 。 然 而 ， 可 能 会 出 现 类 级 别 的 实例 变量 。 更 重要 的 是 ， 它 改变 了 对 象 的 功能 。 这 个 问题 称 为 模 
























































一 个 对 象 的 实例 变量 和 类 的 属性 在 Python 中 有 很 正式 的 差别 。 我 们 的 设计 需要 考虑 到 这 


些 区 别 。 当 需要 展示 对 象 的 动态 状态 时 ， 需 要 定义 一 个 对 象 的 实例 变量 。 而 类 中 对 象 需要 共 





















































享 的 信息 会 有 选择 地 定义 类 级 别 的 属性 。 如 果 我 们 可 以 只 保存 对 象 的 动态 状态 一 一 与 类 和 类 
定义 所 包含 的 引用 关系 区 分 开 一 一 这 就 需要 序列 化 和 持久 化 的 方案 。 
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~ 


呆 存 类 定义 时 ， 


法 很 简单 。 类 定义 主要 
码 ) ! 






































re 


以 源 代码 形 


不 必 什 么 都 做 。 我 们 
式 存在 。 


保存 一 一 JSON、YAML、Pickle、CSV 和 XML 


















































取出 ， 创 建 在 内 存 ! 
Python 党 用 的 术语 














Python 的 常 
方法 。 








dump (obJject , file) 





口 








dump (opject): 返 





loads (string): 从 一 个 


load (file): 从 指定 文件 中 加 


[== 


字符 



































的 字符 串 表 示 。 


于 将 对 象 转 储 到 一 个 指定 文件 
一 个 对 象 
载 一 个 对 象 ， 返 回 新 构造 的 对 象 。 


出 








术语 主要 是 与 dump 和 load 有 关 的 。 在 所 定义 的 大 多 数 类 




















串 加 载 一 个 对 象 ， 返 





口 














这 里 并 没有 固定 的 规则 , 在 任何 1 



































使 用 。 多 
对 象 .可 以 














j ， 它们 仍然 被 广泛 使 用 。 通 
使 用 read () 和 readline () 这 禁 
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是 

















情况 下 ， 用 了 


























E 式 的 ABC 继承 或 是 mixin 
转 储 或 加 
的 一 些 方法 来 实现 力 


已 经 将 定义 与 其 他 部 分 完全 分 离 了 ， 并 且 所 月 
类 定义 在 每 次 需要 的 时 候 被 
。 如 果 需 要 交换 类 定义 ， 也 要 交换 Python 的 模块 或 包 。 














构造 的 对 象 。 











类 定义 ! 














都 六 




















会 包含 如 下 几 种 





目的 方 
新 从 源 代 码 〈 或 字 节 





F 没 有 限制 方法 名 称 的 
载 的 文件 可 以 是 任何 类 似 于 文件 的 
0 载 , 但 我 们 需要 的 比 这 些 还 要 多 。 


因此 ， 可 使 用 io.StringIo 对 象 J urllib.request 对 象 作为 加 载 的 数据 源 。 类 似 地 ， 转 储 方 
面 也 对 数据 源 有 一 定 要 求 ， 接 下 来 会 对 这 些 文件 对 象 进行 讨论 。 


9.2 文件 系统 和 了 网络 的 考虑 





大 







































































为 一 个 序列 化 的 字 节 流 。 经 常会 使 用 两 个 步骤 来 将 对 象 转换 为 字 节 ， 先 将 一 个 对 象 的 状态 以 字符 串 
的 形式 表示 ， 然 后 使 用 Python 字符 串 中 的 标准 编码 来 进行 字 节 转换 。 使 用 Python 中 内 置 的 字符 串 








编码 功能 处 理 这 种 问题 很 简便 。 











AI 








把 视线 移 至 OS 文件 系统 上 时 





日 





































































































为 OS 文件 系统 (和 网 络 ) 是 以 字 节 的 形式 工作 的 ， 所 以 需要 将 一 个 对 象 实例 变量 的 值 表达 





可 以 看 到 设备 分 为 两 大 类 : 块 设备 与 字符 设备 。 块 设备 也 可 称 为 


可 查找 设备 ， 因 为 OS 文 持 在 一 个 指定 文件 中 对 任意 字 节 进行 查找 操作 ， 它 们 是 随机 排列 的 。 字 符 设 备 
是 不 可 碍 找 的 ， 它 们 是 字 节 连续 传输 的 接口 。 查 找 操 作 将 会 变 得 迟缓 。 

字符 与 块 的 区 别 会 影响 我 们 选择 以 什么 方式 来 表达 一 个 复杂 对 象 或 对 象 集合 。 本 章 所 包括 的 序 
列 化 操作 将 专注 于 几 种 简单 的 功能 : 一 个 排序 的 字 节 流 没 有 利用 可 碍 找 设备 的 格式 ， 它 们 将 节省 从 














字 节 到 字符 模式 或 块 模式 的 流传 输 。 
保存 和 获取 对 象 ” 和 第 11 章 “| 























Shelve 











然而 ， 在 第 10 章 “ 用 








为 了 对 超出 内 存 大 小 的 对 象 进行 编码 , 需要 使 月 






















































































文件 的 使 用 方式 进行 了 扩展 。 
在 OS 中 ,将 块 模式 与 字符 














模式 设备 统一 称 为 文人 

















设备 之 间 常用 的 底层 功能 集合 。 当 使 
的 本 地 文件 。 当 打开 一 个 本 地 文件 时 ， 这 个 模块 必须 对 可 查 














3 











系统。 在 Python 标 ; 


Python 的 urllib.request 时 , 可 











入 库 ! 



































找 的 文件 使 有 


字 和 


模式 的 接 


， 实 现 了 块 与 
] 以 访问 网 络 资源 以 及 数 
口 。 





] SQLite 保存 和 获取 对 象 ”中 ， 
日 块 模式 存储 。shelve 模块 和 SQLite 数据 库 对 可 查找 





a 


村 3 村 


9.3 定义 用 于 持久 化 的 类 


在 开始 进行 持久 化 之 前 ， 需 















































要 先 获得 要 保存 的 对 象 。 关 于 持久 化 的 设计 有 几 个 要 点 需要 
简单 的 博客 和 上 面 所 发 布 的 文章 ， 以 下 是 一 个 Post 
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一 个 简单 的 类 定义 为 起 始 。 我 们 将 看 一 个 简 
import datetime 
class Post: 
def _init ( self, date, titile, rst text, tags ): 

self.date= date 
self.title= title 
self.rst text= rst text 
self.tags= tags 


def as dict( self 
return dict( 
date= strl(self.date), 

title= self.title, 


) : 






































考虑 ， 将 以 
类 的 定义 。 














underline= "-"*l]len(self.title), 
rst text= self.rst text, 
tag text= " ".join(self.tags), 
) 
每 篇 博客 的 文章 属性 中 包含 了 这 些 实例 变量 : 日 期 、 标 题 、 一 些 文字 和 一 些 标签 。 属 性 名 称 中 已 
经 暗示 了 文字 需要 使 用 RST 标记 ， 尽 管 这 在 很 大 程度 上 与 其 他 的 数据 模型 无 关 。 
为 了 对 简单 的 模板 替换 进行 支持 ，as_qdict () 方法 会 返回 一 个 字典 ， 其 中 的 每 个 值 都 被 转换 
























































为 





字符 串 格式 。 接 下 来 会 介绍 如 何 使 用 























string.Template 进行 模板 处 理 。 












































补充 一 点 说 明 ， 我 们 已 经 加 入 了 一 些 值 ) 
用 纯 文本 进行 标记 的 元 组 值 时 性 


来 辅助 创建 RST 的 输 昌 
生成 J 














。underline | 









































一 个 以 下 划 线 为 起 始 的 字 
字符 串 是 相 匹配 的 ， 这 使 得 RST 格式 化 的 操作 很 方便 。 我 们 也 会 创建 一 篇 包含 了 多 篇 文章 的 博 








H 结 果 。tag text 属性 


是 一 个 




















过 在 标题 上 附加 属性 来 实现 
装 、 扩 展 或 新 建 。 可 以 结合 这 





























点 来 进行 设计 , 为 了 减少 一 些 





台 b 全 :年 
有 此 去 后 


扩展 一 个 可 迭代 的 对 象 可 
当 扩展 一 个 序列 时 ， 我 们 可 


告 成 困惑 


AM 2 旦 4 





























个 集合 ,而 不 是 简单 地 使 用 一 个 列表 。 在 进行 集合 

















响 了 其 内 置 的 序列 化 算法 。 当 通 






































符 串 ， 它 的 长 度 与 标 


设计 时 有 3 种 选择 : 圭 
困惑 : 如 果 打 算 持 久 化 就 不 要 扩展 List。 























文 。 





ey 月 已 甩 ]/ 
QQ 过 在 子 类 加 入 功能 来 扩展 一 个 序列 时 ， 其 内 置 的 算法 可 能 并 不 会 
调用 我 们 的 实现 。 比 起 扩展 一 个 序列 ， 封 装 通常 更 受 当 。 
这 强制 我 们 必须 使 用 封装 或 新 建 的 方式 。 如 果 只 需要 一 个 简单 的 序列 ， 为 什么 要 新 建 呢 ? 封装 
才 是 我 们 所 推荐 的 设计 策略 。 这 里 是 一 个 微 博 文章 的 集合 ， 封 装 了 一 个 集合 ， 因 为 对 集合 扩展 的 方 
式 有 些 不 够 稳定 。 


from collections import defaultdict 
class Blog: 
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def init ( self, title, posts=None ) : 

self.title= title 

self.entries= posts if posts is not None else [] 
def append( self, post ): 





self.entries.append (post) 
def by tag(self): 
tag index= defaultdict (1List) 
for post in self.entries: 
for tag in post.tags: 
tag index[tag] .append( post.as dict() ) 
return tag index 
def as dict( self ) : 
return dict( 
title= self.title, 
underline= "="*]en(self.title), 


entries= [p.as dict() for p in self.entries], 





) 


为 了 更 完整 地 完成 集合 的 封装 ， 也 使 用 了 一 个 属性 作为 微 博 的 标题 。 初 始 化 过 程 使 用 了 常用 的 
技术 来 将 默认 值 创建 为 不 可 变 对 象 。posts 的 默认 值 为 None， 如 果 posts 是 None， 实际 是 一 个 
新 建 的 空 集合 [] 。 和 否则 ， 使 用 传 入 的 值 为 文章 赋值 。 
另外 ， 还 定义 了 一 个 方法 ， 基 于 标签 为 博文 创建 索引 。 在 返回 的 defaultdict 结果 中 ， 每 个 
键 实 际 就 是 标签 的 文本 ， 每 个 值 是 每 个 标签 所 对 应 的 文章 列表 。 
为 了 简化 string .Template 的 使 用 , 我 们 添加 了 另 一 个 as_dict 方法 , 用 于 将 博客 转换 为 
一 个 简单 的 由 字符 串 所 组 成 的 字典 或 字典 的 集合 。 这 个 思路 就 是 基于 内 置 类 型 来 生成 字符 串 的 表达 
EB 式 。 接 下 来 将 介绍 模板 的 处 理 过 程 ， 以 下 是 一 些 示例 数据 。 


travel = Blog( "Travel" 























一 

























































































二 







































































































































































travel.append( 
Post( date=datetime.datetime (2013,11,14,17,25), 
title="Hard Aground", 
rst text="""Some embarrassing revelation. 
Including ®@ and Bb """, 
tags=("#RedRanger", "#Whitby42", "#ICWwW"), 
) 
) 
travel.appendl( 
Post( date=datetime.datetime (2013,11,18,15,30), 
title="Anchor Follies", 
rst text="""Some witty epigram. Including < & > 
characters.™"",, 
tags=("#RedRanger", "#WwWhitby42", "#Mistakes"), 
) 
) 


我 们 已 经 将 Blog 和 post 序列 化 成 了 Python 代码 。 这 种 表示 博客 的 方式 并 不 是 没有 优势 。 对 
于 一 些 使 用 场景 ，Python 代码 恰恰 是 表达 对 象 的 最 佳 方式 。 在 第 13 章 “ 配 置 文件 和 持久 化 ”中 ， 
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我 们 将 更 深入 地 介绍 如 何 使 用 Python 对 数据 进行 编码 。 


演 染 博客 与 文章 列表 


在 实现 的 过 程 中 ， 这 里 采用 了 将 博客 演 染 为 RST 的 方式 。 从 输出 文件 来 看 ，docutils 中 的 
rst2html.py 工具 可 用 于 将 RST 结果 转换 为 最 终 的 HTML 文件 。 这 避免 了 我 们 做 一 些 额外 的 有 关 
HTML 和 CSS 的 工作 。 而 且 ， 在 第 18 章 “ 质 量 和 文档 ”中 ， 我 们 将 使 用 RST 来 编写 文档 。 有 关 
docutils 的 更 多 内 容 ， 可 查看 前 言 部 分 的 一 些 内 容 。 

可 以 使 用 string .Template 类 来 完成 这 项 工作 。 然 而 ， 它 显得 不 够 轻巧 而 且 很 复杂 。 有 很 多 
插件 模板 工具 可 以 实现 更 复杂 的 处 理 过 程 ， 包 括 模 板 中 的 循环 和 条 件 语 句 处 理 。 这 里 是 一 个 列表 : 
https://wiki.python.org/moin/Templating。 我 们 将 介绍 一 个 使 用 Jinja2 模板 工具 的 示例 ,详细 介绍 参见 
https://pypi.python.org/pypi/Jinja2。 以 下 是 一 个 基于 模板 使 用 脚本 来 实现 RST 数据 的 演 染 过 程 。 

from jinja2 import Template 

blog template= Template( "mnn 


{{title}} 
{{underline}} 































































































































































































































































































{$$ for e in entries %} 
{{e.title}} 
{{e.underline}} 


{{e.rst text}} 
:date: {{e.date}} 


:tags: {{e.tag text}} 
{$$ endfor %$} 
Tag Index 


$ for 七 in tags %} 


{{t}} 
%$ for Post in tags[t] %} 


= {pOStotitlel} 


9 


$ endfor %} 
$ endfor %$} 


mn 


print( blog template.render( tags=travel.by tag(), **travel.as dict() 
) ) 


{{title}j}j 和 {{tunderlinej})} 元 素 ( 和 所 有 类 似 的 元 素 )， 演 示 了 它们 的 值 是 如 何 被 蔡 换 为 
模板 中 的 文字 的 。render() 方法 被 **travel.as qict () 调用 ， 来 确保 类 似 title 和 
underline 这 样 的 属性 可 作为 关键 字 参 数 。 

{$forg%} 和 {%endfor%s} 结 构 演示 了 Jinja 如 何 对 Blog 中 的 所 有 Post 集合 进行 迭代 。 在 循 
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环 体 ! 























) 变量 e 是 基于 每 个 Post 所 创建 
{{e.title}}，{{e.rst text}}， 等 等 。 

我 们 也 为 Blog 做 了 tags 集合 的 迭代 操作 。 
循环 将 访问 每 个 键 ， 然 后 赋值 给 七 。 在 循环 体 : 





第 9 章 序列 化 和 保存 一 一 JSON、YAML、Pickle、CSV 和 XML 
































&。 我 们 为 每 篇 文章 从 字 : 





中 选择 了 不 同 的 键 ， 





的 字 


























它 是 一 个 字 
会 迭代 字典 ! 


















































'{ {post.title}}' 结构 是 一 个 RST 标记 ， 用 于 生成 指向 















































4, 键 为 标签 , 值 为 标签 对 应 的 文章 列表 。 
所 存放 的 每 一 篇 文章 ， 即 tags [t] 。 





文档 中 每 个 标题 所 对 应 的 节 。 这 类 









































简单 的 标记 是 RST 的 优势 之 一 。 在 索引 范围 内 ， 我 们 将 博客 标题 作为 节 和 链接 。 这 意味 着 标题 必 
须 是 唯一 的 ， 否 则 将 得 到 RST 演 染 错误 。 
于 这 个 模板 会 对 指定 博客 进行 迭代 ， 因 此 它 将 一 次 性 泻 染 











所 有 的 文章 。 而 Python 中 内 置 的 











string.Templete 不 可 以 迭代 ， 这 使 得 演 染 博客 中 所 有 文章 的 这 项 任务 变 得 有 一 些 复杂 。 
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JSON 是 什么 ? 摘自 www.json.org 网 页 中 的 





























段 描述 : 




















JSON (JavaScript Object Notation ) 是 一 种 轻 量 级 的 数据 交换 格式 ， 刀 于 人 阅读 和 编写 。 同 时 也 易 
于 机 器 解析 和 生成 。 它 基于 JavaScript Programming Language,Standard ECMA-262 3rd Edition-December 


1999 的 一 个 子 集 。 


JSON 采用 完全 独立 于 语言 的 文本 格式 ， 但 是 也 使 用 了 类 似 于 C 语言 家 族 的 习惯 ( 包 


括 C、C++、C#、Java、JavaScript、Perl 和 Python 等 )。 这 些 属性 使 JSON 成 为 理想 的 数据 交换 语言 。 























这 种 格式 被 广泛 地 用 了 
象 ， 简 化 了 应 | 























各 种 语言 和 框架 ， 而 
程序 间 数 据 的 转化 。JSON 文档 


















































list 和 dict 是 相似 的 。 它 们 都 
json 模块 可 以 与 Python 中 内 置 的 类 型 有 效 地 工作 。 
一 些 额外 的 工作 。 接 下 来 会 介绍 有 关 这 些 扩展 


















































有 很 强 的 可 读 性 ， 并 
































象 CouchDB 这 样 的 数据 库 会 
有 模糊 查找 的 优势 ， 在 这 点 上 ， 和 Python 中 的 
修改 起 来 很 容易 。 


[ 接 保 存 JSON 对 












































可 它 不 能 与 自 定义 的 类 一 起 工作 ， 除 非 做 
的 技巧 , 对 于 如 下 几 种 Python 类 型 ， 都 对 应 了 JSON 








中 所 使 用 的 javascript 类 型 。 

Python 类 型 JSON 
dict object 
list, tuple array 
str string 
int, float number 
True true 
False false 
None ful. 


除了 以 上 定义 的 几 种 类 型 ， 其 他 类 型 都 不 支持 ， 
类 型 ， 这 些 函 数 可 以 使 用 插件 式 设计 来 实现 转 储 和 






































并 且 必 须 使 ) 














扩展 函数 将 其 转换 为 以 上 的 一 种 














加 载 功能 。 














我 们 可 以 通过 将 微 博 对 象 转换 为 























Python : 


的 1ists 和 qicts 类 型 来 探究 这 些 内 置 类 型 。 当 把 视线 转移 到 Post 和 





9.4 



























































时 ， 会 发 现 已 经 定义 了 as_dict () 方 法， 
代码 基于 博客 数据 生成 JSON 串 。 


import json 

















于 将 自 定义 的 对 象 转化 为 Python ' 




















"#RedRanger #Whitby42 #ICW", 


"Some embarrassing revelation. 


Including \ 


print( json.dumps (travel.as dict(), indent=4) ) 
以 下 是 输出 : 
{ 
"ventries™:; ‘[ 
{ 
"title": "Hard Aground", 
VUNder liner 及 二 二 二 二 二 二 二 二 二 二 二 二 ny 
"tag text": 
i a A = 汪 
u2639 and \u2693", 
"date": "2013-11-14 17:25:00" 
}, 
{ 
"title": "Anchor Follies", 





"underline": 


7 


"#RedRanger #Whitby42 #Mistakes", 


Including < & > 


"tag text": 

"rst text": "Some witty epigram. 
characters.", 

"date": "2013-11-18 15:30:00" 


} 
], 
VE .TTYel 


} 
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Blog 的 类 定义 
内 置 的 对 象 。 以 下 



















































































































































































以 上 输出 演示 了 不 同 的 对 象 是 如 何 从 Python 对 象 转 化 为 JSON 格式 的 。 以 上 代码 优雅 的 部 分 
是 ,Python 对 象 被 写成 了 标准 化 的 格式 , 可 以 与 其 他 应 用 共享 , 也 可 以 将 它们 写 入 磁盘 文件 并 保存 。 
此 外 ，JSON 这 种 数据 表现 形式 也 有 几 点 不 方便 的 地 方 。 
@ 如果 必须 将 Python 对 象 重 写 为 字典 , 应 该 提供 一 种 更 好 的 转换 方式 , 不 必 额 外 地 创建 字典 对 象 。 
@ 当 我 们 加 载 这 个 JSON 数据 时 ， 并 不 能 够 轻易 地 恢复 之 前 的 Blog 和 Post 对 象 。 
当 我 们 使 用 json .1oad () 时 ， 并 不 会 得 到 Blog 或 Post 对 象 ， 仅 仅 能 够 得 到 qi ct 
和 集合 对 象 。 在 创建 Blog 和 Post 对 象 时 ， 我 们 需要 额外 的 信息 。 
@ 对 于 对 象 内 _dqict 中 的 一 些 值 我 们 并 不 希望 保存 ， 例 如 Post 中 下 划 线 的 文字 。 
除了 内 置 的 JSON 编码 外 ， 还 需要 做 些 更 复杂 的 工作 。 








9.4.1 在 类 中 支持 JSON 


需要 提供 一 个 函数 ， 将 对 象 转换 为 Python 中 的 




















为 了 正确 地 支持 JSON， 在 使 需要 先 考虑 编码 与 解码 。 为 了 将 对 象 编码 为 JSON， 


本 类 型 。 这 个 函数 被 称 为 aefault 函数 ， 为 已 知 类 


类 之 前 ， 









































es 
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的 对 象 提 供 了 默认 的 编码 方式 。 

为 了 将 对 象 从 JSON 中 解码 ， 需 要 提供 一 个 函数 ， 用 于 将 由 Python 基本 类 型 组 成 的 字典 转换 
为 一 个 对 象 。 这 个 函数 被 称 为 object hook 函数 ， 用 于 将 dict 转换 为 一 个 自 定 义 对 象 。 

json 模块 文档 中 包含 了 如 何 使 用 类 的 提示 。Python 文档 包含 了 一 个 对 JSON-RPC 第 1 版 本 的 参 
考 引 用 。 可 以 参见 http://json-rpc.org/wiki/specification。 这 个 建议 是 将 自 定义 类 的 对 象 编码 为 字典 形 
式 ， 如 下 所 示 。 


{" Jsonclass, "» ["cLlass name", [paraml,..%.]] } 


与 " jsonclass " 值 相 关 的 值 包含 了 两 项 ， 类 名 称 和 所 需 的 参数 列表 ， 它 们 用 于 创建 类 的 
实例 。 还 可 以 包含 更 多 的 功能 ， 但 都 与 Python 无 关 。 

为 了 将 一 个 对 象 从 JSON 字典 中 解码 ， 作 为 一 种 提示 ， 我 们 可 以 查找 "jsonclass_" 键 ， 
月 于 创建 自 定 义 类 中 的 其 中 一 个 ， 不 是 Python 内 置 的 对 象 。 类 名 可 被 映射 为 类 对 象 ， 而 参数 序列 
可 用 于 创建 实例 。 

当 讨 论 更 复杂 的 JSON 编码 器 (例如 其 中 一 个 内 置 于 Django Web 框架 ) 时 ， 可 以 看 到 它们 
为 自 定 义 类 提供 了 一 些 更 复杂 的 编码 。 它 们 包括 了 类 、 数 据 库 的 主键 以 及 属性 值 。 这 些 规 则 将 
表现 为 一 些 简单 的 函数 ， 并 以 插件 的 形式 加 入 JSON 的 编码 与 解码 的 函数 中 。 


9.4.2 自 定 义 JSON 编码 


类 的 提示 可 以 提供 3 部 分 信息 : 一 个 _class_ 键 ， 作 为 目标 类 的 命名 ，_args_ 键 ， 将 提 
供 一 个 位 置 参 数值 的 序列 ， 一 个 _kw_ 值 ， 将 提供 一 个 关键 字 参 数值 的 字典 , 包含 了 _init__() 
的 所 有 选项 。 以 下 是 这 种 设计 的 编码 器 的 一 个 实现 示例 。 
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def blog encode( object ): 
if isinstance(object, datetime.datetime): 
return dict( 


class = "datetime.datetime", 
_args = []， 
kw = dictl( 


year= object .year, 
month= object.month, 
day= object.day, 
hour= object.hour, 
minute= object .minute, 
second= object.secongd, 
) 
) 
elif isinstance (object, Post): 
return dict( 


_Cclass = "Post", 
_args = []， 
kw = qict( 


date= object.date, 
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title= object.title, 
rst text= object.rst text, 
tags= object .tags, 


) 
elif isinstance (object, Blog): 
return dict( 
class = "Blog", 
_args = [ 
object .title, 
object .entries, 


else: 





return json.JSONEncoder.default (o) 





这 个 函数 演示 了 对 3 个 类 对 象 编码 操作 的 两 种 不 同 风 格 。 
@ 将 datetime.datetime 对 象 编码 为 一 个 字典 ， 其 中 包含 了 独立 的 字段 值 。 
@ 将 Post 对 象 编码 为 一 个 字典 ， 也 包含 了 独立 的 字段 值 。 
@ 将 Blog 实例 编码 为 由 标题 和 文章 组 成 的 一 个 序列 。 


如 果 不 能 处 理 这 个 类 ， 将 使 用 默认 的 编码 器 进行 编码 。 这 将 能 够 有 效 地 处 理 内 置 的 类 。 可 以 使 
用 这 个 函数 来 像 如 下 这 样 来 编码 。 



































































































































text= json.dumps (travel, indent=4, default=blog encode) 

















为 了 调用 json .qumps () 函数 ， 提 供 了 我 们 的 函数 ，plog_encode () 作为 default= 关 键 字 的 
参数 。 这 个 函数 由 JSON 编码 器 用 来 决定 对 象 的 编码 方式 。 这 个 编码 器 的 使 用 导致 ON 对 象 的 结 
构 将 如 下 代码 所 示 。 


{ 












































pa 


= ole = Sl 
"Travel", 


[ 


"rg 3 [3 
™ Kw vs { 

"tags": [ 
"#RedRanger", 
"#Whitby42", 
"#ICW" 

] 了 

"rst text": "Some embarrassing revelation. 

Including \u2639 and \u2693", 

date™: ,{ 
args. VY [ly 
RW" Af 
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"minute": 25, 
vheur™: 17y 
"day": 14, 
"month ss 1; 
"year": 2013, 
"second": 0 

}, 

" class ": "datetime.datetime" 


}, 

















































































































































































































"title": "Hard Aground" 
}, 
"CTAaSS VY ‘TPOSt™ 
}, 
"KW _™: { }y 
"CLass Vv: TBLIOG” 

} 

我 们 拿 掉 了 第 2 条 博客 记录 ， 因 为 输出 结果 太 长 了 。 一 个 Blog 对 象 由 dict 完成 封装 ， 它 提供 
了 类 和 两 个 位 置 参 数值 。 相 似 地 ，Post 和 datetime 对 象 的 类 名 和 关键 字 参 数 信 也 被 封装 了 起 来 。 
9.4.3” 自 定义 JSON 解码 

为 了 对 一 个 JSON 对 象 进行 解码 ， 我 们 需要 在 JSON 结构 的 解析 上 下 工夫 。 自 定义 类 的 对 象 被 
编码 为 简单 的 dicts。 这 意味 着 每 个 由 JSON 解码 器 解码 的 dict 都 可 能 是 自 定义 类 中 的 一 个 , 或 
者 它 只 是 一 个 dict。 

JSON 解码 器 中 “对 象 钩子 ”是 一 个 被 di ct 调用 的 函数 ， 用 于 检验 是 否 被 正确 地 表达 成 了 自 
定义 对 象 。 如 果 dict 没有 被 hook 函数 识别 ， 那 么 它 仅 是 一 个 字典 并 且 应 当 被 直接 返回 。 以 下 是 
一 个 对 象 钩子 函数 。 

def blog decode( some dict ) : 

if set(some dict.keys()) == set( [" class ", " args ", " 
kw 
class = eval(some dict[' class ']) 
return class_( *some dict[' args '], **some dict[' kw '] ) 
else: 


return some dict 


每 当 这 个 函数 被 调用 时 ， 它 检查 所 有 用 




































































2 


于 编码 的 键 。 如果 有 3 个 键 存在 ， 则 调用 这 个 函数 ， 





并 传 入 它 的 参数 和 关键 字 。 可 使 有 








崩 对 象 钩子 完成 JSON 对 象 

















的 解析 ， 如 下 代码 所 示 。 


blog data= json.loads (text, object 


_hook= blog decode) 








这 将 





完成 JSON 格式 文本 块 的 解码 ， 使 用 








Blog 和 Post 对 象 。 





J blog aqecodae () 


函数 来 将 dict 转换 为 适当 的 
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9.4.4 安全 性 和 eval0 


一 些 程序 员 会 反对 在 blog_decode () 函数 中 使 用 eval () 函数 ， 声 称 这 是 一 个 普遍 的 安全 问 
题 。 认 为 eval () 是 一 个 普遍 问题 的 说 法 是 思春 的 。 如 果 有 恶意 的 天 才 程 序 员 (Evil Genius 
Programmer, EGP ) 将 恶意 代码 写 入 对 象 的 JSON 表达 式 中 , 这 的 确 是 一 个 潜在 的 安全 问题 ,一 个 EGP 
是 可 以 获取 Python 源 代码 的 ， 但 为 什么 仅仅 是 折腾 JSON 文件 ， 而 不 去 直接 编辑 Python 源 代码 ? 
实际 上 ， 我 们 需要 关注 JSON 文件 在 网 络 上 的 传输 过 程 ， 这 是 一 个 实际 的 安全 性 问题 。 然 而 ， 


这 个 过 程 一 般 不 会 


有 丘 才 
景 需要 











































































































注意 到 eval ()。 

















有 了 时， 一 个 文件 在 网 络 传输 过 程 中 可 能 被 中 间 人 算 改 成 为 不 可 靠 的 文件 ， 对 于 这 样 的 场 





制定 一 些 规则 。 这 样 的 话 ， 每 当 一 个 JSON 文件 在 通过 一 个 Web 接口 时 就 需要 被 验证 
它 有 可 能 是 一 个 不 可 靠 的 服务 器 代理 。SSL 通常 是 解决 这 类 问题 的 首选 方案 。 











































































































如 果 村 必要 ， 




















可 以 将 eval() 替换 为 一 个 字典 ， 完 成 从 名 字 到 类 的 映射 。 我 们 可 以 将 











eval (some dict[' class ']) 改 为 {"Post":Post, "Blog":Blog, "datetime. 
datetime":datetime.datetime: 


级 


E 护 成 本 ， 当 应 | 











} [some dict 


"SLassa | 








这 样 就 可 以 避免 当 JSON 文件 传输 时 使 用 的 是 非 SSL 加 密 的 连接 。 这 个 做 法 也 需要 增加 相应 的 




















9 








j 的 设计 改变 时 ， 这 里 的 映射 也 要 改变 。 


.4.5 重 构 编码 国 数 











E 想 情况 下 ， 

















我 们 当然 不 希望 将 























我 们 会 希望 重 构 编码 函数 ， 为 了 提高 对 每 个 定义 的 类 进行 编码 的 职责 的 内 聚 性 。 
大 量 的 编码 规则 分 布 在 不 同 的 函数 中 。 













































































如 果 要 修改 类 库 中 类 的 编码 行为 ， 例 如 qatetime， 就 需要 在 应 用 程序 中 对 datetime. 
datetime 进行 扩展 。 这 样 一 来 ， 就 需要 确定 在 我 们 的 应 用 
































使 用 了 扩展 版 本 而 不 是 类 库 版 本 ， 而 












































完全 避免 使 用 内 置 的 datetime 类 并 不 是 非常 容易 。 通常 情况 下 , 需要 在 自 定 义 与 类 库 之 间 找 到 一 


个 平衡 




















@property 





























点 。 以 下 是 两 个 类 的 扩展 ， 用 于 创建 带 有 JSON 编码 能 力 的 类 。 可 以 为 Blog 添加 一 个 特性 。 














def json( self ): 


return dict( _class = self. class . name ， 
kw = {}, 
_args = [ self.title, self.entries ] 


) 














这 个 特性 被 ) 





j 来 提供 解码 函数 所 使 用 的 初始 化 参数 。 可 以 向 Post 添加 这 两 个 特性 。 














QProPerty 


def json( self ) : 


return dict( 


_Cclass = self. class . name ， 
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kw = Qict( 
date= self.date, 
title= self.title, 
rst text= self.rst text, 
tags= self.tags, 
), 
_args = [] 


) 























对 于 Blog， 这 个 特性 将 用 来 提供 初始 化 参数 。 它 们 会 被 解码 函数 使 用 ， 可 以 修改 编码 器 




















它 更 简洁 一 些 ， 以 下 是 修改 后 的 版 本 。 


def blog encode 2( object ) : 
if isinstance(object, datetime.datetime): 
return dict( 


class = "datetime.datetime", 
_args = [], 
kw = dictl( 


year= object .year, 
month= object.month, 
day= object.day, 

hour= object.hour, 
minute= object .minute, 


second= object.secongd, 


encoding= object. json() 





except AttributeError: 





encoding= json.JSONEncoder.default (o) 


return encoding 

















使 
> | 入 


























你 或 许 纠 结 于 是 否 要 使 用 类 库 中 的 aatetime 模块 。 在 本 例 中 ， 选 择 不 引入 子 类 ， 而 是 将 编码 








作为 一 个 特例 。 
9.4.6 日 期 字符 串 的 标准 化 



















































































应 当 用 标准 字符 串 对 aatetime 对 象 进行 适当 的 编码 ， 并 能 够 解析 一 个 标准 字 
对 为 把 日 期 当 作 了 特例 ， 从 扩展 性 上 来 说 ， 这 样 做 是 明智 的 。 无 需 对 编码 和 解码 进行 太 多 的 改 



































动 就 能 够 完成 。 如 下 是 对 编码 改动 后 的 一 种 实现 : 


if isinstance (object, datetime.datetime): 
fmt= "%Y-%Sm-%SdT%$H: $M:$S" 
return dict( 





_Cclass = "datetime.datetime.strptime", 





_args = [ object.strftime(fmt), fmt ], 


日 期 格式 化 并 没有 使 用 被 广泛 使 用 的 ISO 标准 文本 格式 的 日 期 ,为 了 更 好 地 与 其 他 语言 章 




















Ar 曲 


符 虽 


ud 
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民 合 ， 
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经 过 编码 的 输出 中 包含 了 静态 方法 datetime .datetime.strptime () 并 提供 了 与 datetime 
编码 的 参数 ， 以 及 用 于 解码 的 格式 。 一 篇 文章 的 输出 可 能 如 下 代码 段 所 示 。 


























m args [] 7 

" class ": "Post J", 

"kw ": { 
"title™: "ANChor FoLlies"y 
"tags": [ 


"#RedRanger", 
"#Whitby42", 


"#Mistakes" 
], 
"rst text": "Some witty epigram.", 
"date": { 

" args ": [ 


"2013=-11- 18T15:30:00™, 
"SY-Sm-%dT%$H: SM: Ss" 


], 
" class ": "datetime.datetime.strptime", 
LA kw m { } 


} 

这 意味 着 我 们 现在 使 用 的 是 ISO 格式 的 日 期 , 而 不 是 独立 的 字段 , 并 且 不 再 使 用 类 名 来 创建 对 
象 。 class 的 值 被 扩展 成 为 了 一 个 类 名 或 静态 方法 名 。 
9.4.7 将 JSON 写 人 文件 
当 我 们 写 JSON 文件 时 ， 通 常会 像 如 下 代码 这 样 实现 。 


with open("tempb. json"，"w" encoding="UTE-8") as target: 
':'), default=blog_ 




































































json.dump( travel3, target, separators=(',', 
j2_encode ) 


以 所 需 的 编码 格式 打开 文件 ， 给 json .dump () 方法 传 入 文件 对 象 。 当 读 JSON 文件 时 ， 可 以 
使 用 一 个 类 似 以 下 这 样 的 技巧 。 


with open("some source.json", "r", encoding="UTE-8") as source: 
































objects= json.load( source, object hook= blog decode) 


思路 是 ， 将 JSON 作为 文本 的 表示 方式 与 字 节 转换 的 过 程 进行 分 离 。 在 JSON 中 有 一 些 格式 化 的 方 
式 可 以 选择 。 在 之 前 的 例子 中 缩 进 了 4 个 空格 是 为 了 生成 更 美观 的 JSON 输出 。 还 有 一 种 选择 ， 可 使 得 输 
出 更 紧凑 而 不 使 用 缩 进 。 可 以 使 分 隔 符 更 简洁 ， 从 而 对 其 进一步 压缩 。 如 下 是 temp . json 生成 的 输出 。 




























































































192 第 9 章 序列 化 和 保存 一 一 JSON、YAML、Pickle、CSV 和 XML 





{": ‘ClasSs "VBLOg yy Hrgs. "Hh Travel Ll{" class "Post J = 
args "i:[]," kw ":{"rst text":"Some embarrassing revelati 
on.","tags": ["#RedRanger", "#Whitby42","#ICW"], "title":"Hard 

Aground", "date":{" class ":"datetime.datetime.strptime",™" 

args. ":["2013=11-14T17:25%00" "SY-Sm SdLsH: SM:SS" | 

Kw et OLaSs "BOst dp orgs well KW vf "rst 
text":"Some witty epigram.", "tags":["#RedRanger", "#Whitby42","#Mistak 
es"],"title":"Anchor Follies","date":{" class ":"datetime.datetime. 
strptime"" args. ™:["2013-11=18T15:30:00" "SY=Sm- -SdH:SM: SS 


kw_ "wi:{}}}}]]," kw ":{}} 


9.5 使 用 YAML 进行 转 储 和 加 载 


关于 YAML，yaml.org 网 页 中 是 这 样 描述 的 : 

YAMLm ( 学 camel” 押 韵 ) 是 一 种 人 性 化 的 ， 跨 语言 的 ,基于 Unicode 编码 进行 数据 序列 化 ， 
围绕 敏捷 编程 语言 中 数值 类 型 而 设计 的 语言 。 

在 Python 标准 库 文档 中 关于 json 模块 的 部 分 是 这 样 描述 的 : 

JSON 是 YAML1.2 的 一 个 子 集 . 基 于 这 个 模块 的 默认 设置 ( 尤其 是 默认 的 分 隔 符 ), 将 生成 JSON， 
也 同样 是 YAML1.0 和 1.1 的 子 集 。 这 个 模块 也 可 用 于 YAML 的 序列 化 器 。 

从 技术 的 角度 上 来 看 , 可 使 用 json 模块 来 生成 YAML 数据 。 然而 json 模块 不 能 被 用 来 完成 
民 复 杂 的 YAML 数据 的 反 序列 操作 。 使 用 YAML 有 两 点 优势 : 首先 ， 它 的 格式 本 身 很 复杂 ， 我 们 
可 以 为 对 象 的 附加 信息 进行 编码 ; 其 次 ,， pyYAML 的 实现 在 底层 很 好 地 集成 了 Python， 可 以 很 简单 
也 为 Python 对 象 进行 YAML 编码 。YAML 的 缺点 是 它 的 使 用 范围 不 像 ISON 这 样 广泛 。 我 们 需要 
下 载 安装 一 个 YAML 模块 。 可 以 通过 这 里 进行 下 载 : http:/pyyaml.org/wiki/PyYAML。 一 旦 完成 安装 ， 
就 可 以 使 用 YAML 格式 为 对 象 执 行 转 储 操作 。 


import yaml 
text= yaml .dump (travel2) 
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可 | 


















































| 于 





























Print ( 七 ext ) 
以 下 是 使 用 YAML 编码 后 的 博客 。 


11Python/object: main .Blod 





entries: 

— !!lpython/object: main .Post 
date: 2013-11-14 17:25:00 
rst text: Some embarrassing revelation. Including @ and 沪 
tags: !!python/tuple ['#RedRanger', '#Whitby42', '#ICW'] 
title: Hard Aground 

— !!lpython/object: main .Post 
date: 2013-11-18 15:30:00 
rst text: Some witty epigram. Including < & > characters. 
tags: !!python/tuple ['#RedRanger', ‘'#WwWhitby42', '#Mistakes'] 
title: Anchor Follies 











此 时 的 输出 相对 简洁 但 很 完整 。 而 














YAML 

















lex Python 标签 。 





























J 含 所 定义 的 模块 是 有 意义 的 。 对 了 
Blog 和 main .Post。 当 在 男 一 个 模块 ! 





以 看 出 哪个 模块 定义 了 这 些 类 。 

一 个 列表 中 的 项 将 以 一 个 块 序列 的 形式 呈现 。 每 个 项 以 一 个 -序列 为 起 始 ， 其 余部 分 以 两 个 空 
格 缩 进 。 当 集合 或 元 组 足够 小 ， 可 缩 进 为 一 行 。 当 长 度 增 加 时 ， 就 显示 为 多 行 。 为 了 完成 从 一 个 
可 使 用 如 下 代码 。 























YAML 文档 








加 载 Python 对 象 的 过 程 ， 





copy= yaml.load (text) 


使 用 标签 提供 的 信息 来 完成 对 类 定义 的 查找 定位 ， 并 将 YAML 文档 ! 























函数 ， 进 而 完成 微 博 对 象 的 构造 。 
9.5.1 YAML 文件 的 格式 化 





yaml .Qump ( 


使 用 所 需 的 编码 打开 文件 。 将 文件 对 象 传 给 yaml .dump ( ) 方法 ; 进而 完成 输 H 














文件 时 ， 会 使 ) 






































当 写 YAML 文件 时 ， 通 常会 像 如 下 代码 这 样 做 。 


with open("some destination.yaml", "w", encoding="UTF-8") 


some collection, target ) 











j 类 似 的 技巧 。 


with open("some_ sourc 























explicit start 


explicit end 


version 
tags 
canonical 
indent 


width 


allow unicode 


line break 


思路 是 将 YAML 作为 文本 的 
们 的 数据 创建 更 好 的 YAML 的 表示 。 下 表 列 出 了 其 


如 果 是 true， 则 在 每 个 对 象 前 写 一 个 --- 标 i 


.yamil", 
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， 可 以 直接 通过 编辑 YAML 文件 进 
! 标 签 进行 编码 。YAML 中 包含 了 11 个 标准 的 标签 。yaml 模块 包含 了 很 多 为 Python 定制 
的 标签 以 及 5 个 comp 
在 Python 类 名 ' 
本 ， 因 此 类 名 为 _main . 


"r", encoding="UTF-8") 


objects= yaml.load( source ) 


















































行 更 新 。 类 名 使 用 













































































的 一 些 。 














示 与 字 节 转换 的 过 程 分 开 。 


忆 





pr 





些 格 式 化 的 方式 ， 可 | 











as target: 





as SOUITCe : 




















J 


我 们 的 例子 来 说 ， 模 块 是 一 个 精简 的 脚 
导入 它们 时 ， 从 类 名 就 可 


拿 到 的 值 传 给 类 的 构造 


时 。 当 读 取 YAML 


如 果 为 tue， 则 在 每 个 对 象 前 写 一 个 ... 标 记 。 当 我 们 将 一 个 YAML 文档 的 序列 转 











Fl 


日 














储 到 一 个 文件 





指定 一 个 整数 对 (x,y)， 在 文 伯 

















操作 是 串 行 的 时 候 ， 可 以 全 
F 头 输出 %YAML x. 




















它 或 者 explicit_start 


y， 这 应 该 是 版 本 = (1,2) 


指定 一 种 映射 ， 在 文件 头 使 用 不 同 的 标签 缩写 输出 一 个 YAML %TAG 





如 果 为 rue， 则 每 


x 








决 数 
如 果 设 定 一 个 数字 ， 就 会 改变 块 之 间 的 缩 进 
如 果 设 定 一 个 数字 ， 当 项 太 长 以 至 了 

I 果 设 为 true, 将 支持 完整 的 、 没 有 包含 转 义 符 的 Unicode 编码 。 否则 , 在 ASCIL 





昌都 包含 一 个 标签 ， 
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注 





显示 为 多 行 ， 缩 进行 时 ， 这 个 设 


自己 外 部 的 字符 就 会 包含 使 用 了 转 义 符 的 字符 
用 一 种 不 同 的 行 结束 符 ， 默 认 是 换行 符 


如 果 为 false， 则 认为 包含 了 很 多 标签 


























会 改变 行 宽度 
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以 上 这 些 选 项 : 


9.5.2 扩展 YAML 的 表示 
有 时 ，YAML 默认 的 对 属性 值 的 转 储 行为 ， 











的 card 类 定义 来 说 ， 默 认 的 YAML 会 包括 一 些 衍生 的 值 ， 而 它们 3 


，explicit_end 和 allow unicode 可 能 是 最 常用 的 。 




































































有 关 为 类 定义 添加 描述 器 和 构造 器 这 点 ，yaml 模块 




















某 些 类 有 更 简洁 的 表达 方式 。 例 如 ， 对 于 21 点 中 
不 需要 被 使 用 或 保存 。 
包括 了 一 个 条 款 。 描 述 器 被 用 于 创建 一 





















































种 YAML 的 表示 方式 ， 包 括 一 个 标签 和 值 。 构 造 器 用 于 基于 给 定 的 值 创建 一 个 Python 对 象 ， 这 里 











是 Card 类 层次 结构 的 男 一 种 定义 。 


class Card: 
def. 。 nt ( 
self.rank= rank 


self, rank, suit, 


self.suit= suit 
self.hard= hard or int (rank) 
self.soft= soft or int (rank) 











hard=None, soft=None ): 











































































































































































































































































































































































































def _ str ( self ): 
return "{0.rank!s}{0.suit!s}".format (self) 
class AceCard( Card ): 
def init ( self, rank, suit ): 
super(). init ( rank, suit, 1, 11 ) 
class FaceCard( Card ) : 
def init ( self, rank, suit ): 
super(). init ( rank, suit, 10, 10 ) 

我 们 为 纸牌 定义 了 基 类 并 为 扑克 牌 和 人 头 牌 《扑克 中 的 下 Q、K) 定义 了 子 类 。 在 之 前 的 例子 
中 ， 使 用 了 可 扩展 的 工 广 函 数 来 简化 构造 函数 的 逻辑 。 工 三 完成 了 从 牌 面值 为 1 到 AceCard 类 和 
面值 为 11、12 以 及 13 到 Racecard 类 的 映射 。 这 样 做 是 必需 的 ,因为 只 有 这 样 我 们 才能 够 确保 
可 以 使 用 range (1, 14) 这 样 一 个 简单 的 语句 来 完成 纸牌 的 初始 化 ， 进 而 创建 一 个 deck 对 象 。 

当 加 载 一 个 YAML 文件 时 ， 类 必须 以 YAML 的 !! 标 签 来 阐明 。 唯 一 缺失 的 信息 就 是 与 纸牌 子 
类 中 的 软 点 数 和 硬 点 数 。 对 于 软 点 数 和 硬 点 数 来 说 ， 有 3 种 简单 的 情况 可 以 通过 可 选 的 初始 化 参数 
来 解决 。 当 使 用 默认 的 序列 化 行为 转 储 这 些 对 象 到 YAML 格式 时 ， 可 能 会 表示 如 下 。 

— !!lpython/object: main .AceCard {hard: 1, rank: A, soft: 11, suit: 

和 } 

— !!python/object: main .Card {hard: 2, rank: '2', soft: 2, suit: 9)} 

— !!lpython/object: main .FaceCard {hard: 10, rank: K, soft: 10, 

suit: 全 } 

它们 是 正确 的 ， 但 对 于 打牌 这 样 的 简单 场景 又 显得 有 些 多 余 。 可 通过 扩展 yaml 模块 来 生成 更 
简洁 的 输出 ， 并 且 它 们 将 主要 用 于 简单 对 象 的 表示 。 接 下 来 要 做 的 是 为 Card 子 类 定义 描述 器 和 构造 
器 。 以 下 代码 包含 了 3 个 函数 的 定义 以 及 如 何 将 它们 注册 到 yaml 模块 : 


def card representer (dumper, card) : 


return dumper.represent scalar('!Card', 
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"{0.rank!s}{0.suit!s}".format (card) ) 

def acecard representer (dumper, card): 
return dumper.represent scalar('!AceCard', 
"{0.rank!s}{0.suit!s}".format (card) ) 

def facecard representer (dumper, card): 





return dumper.represent scalar('!FaceCard', 











"{0.rank!s}{0.suit!s}".format (card) ) 


yaml .add representer (Card, card representer) 
yaml .add representer (AceCard, acecard representer) 
yaml .add representer (FaceCard, facecard representer) 








我 们 将 每 个 card 实例 表示 为 一 个 精简 的 字符 串 。 YAML 中 包含 了 一 个 标签 用 来 指定 这 个 字符 
串 被 用 来 创建 哪个 类 。 这 3 个 类 使 用 了 相同 的 格式 化 字符 串 ， 正 好 与 str () 方 法 匹配 ， 因 而 可 
以 进一步 被 优化 。 
另 一 个 需要 解决 的 问题 是 从 解析 后 的 YAML 文档 来 创建 carq 实例 。 对 这 点 来 说 ， 我 们 需要 
构造 器 ， 以 下 定义 了 3 个 构造 器 以 及 它们 的 注册 过 程 。 















































def card constructor(loader, node): 
value = loader.construct scalar (node) 
rank, suit= value[:-1], value[-1] 
return Card( rank, suit ) 


def acecard constructor(loader, node): 
value = loader.construct scalar (node) 
rank, suit= value[:-1], value[-1] 
return AceCard( rank, suit ) 


def facecard constructor(loader, node): 
value = loader.construct scalar (node) 
rank, suit= value[:-1], value[-1] 
return FaceCard( rank, suit ) 


yaml .add constructor('!Card', card constructor) 
yaml .add constructor('!AceCard', acecard constructor) 
yaml .add constructor('!FaceCard', facecard constructor) 























当 一 个 标准 值 被 解析 时 ， 就 会 使 用 标签 来 对 特定 的 构造 器 进行 查找 定位 。 构 造 器 然后 会 对 


























字符 串 进行 分 解 并 创建 card 子 类 的 实例 。 如 下 是 一 个 实例 ， 从 每 个 类 中 转 储 一 张 纸牌 。 


deck = [ AceCard('A','®®',1,11), Card('2','%',2,2), 
FaceCard('K',' 信 ',10,10) ] 
text= yaml .dump( deck, allow unicode=True ) 


以 下 是 输出 结果 。 


[!AceCard 'A%', ICard '2%', !IFaceCard 'K@'] 






























































这 里 给 出 了 一 种 简洁 、 优 雅 的 使 用 YAML 来 表示 纸牌 的 方式 ， 可 用 于 创建 Python 对象。 
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我 们 可 以 使 ) 





化 和 保存 一 一 JSON、YAML、Pickle、CSV 和 XML 





j 如 下 的 简单 语句 来 重新 创建 3 张 牌 : 





cards= yaml.load( text ) 


这 将 使 用 构造 器 函数 来 解析 表达 式 , 然后 创建 所 
W， 以 及 软 硬 点 数 


程 可 被 正常 完 


























属性 也 会 被 正确 地 创建 。 








9.5.3 ”安全 性 与 安全 加 载 


从 原则 上 来 说 ，YAML 可 以 创建 任何 类 型 的 对 象 。 在 网 络 上 传输 YAML 文件 的 过 程 ! 


期 望 的 对 象 。 因 为 构造 器 函数 会 





保 初始 化 过 





确 


























二 








行 控制 ， 

















程序 就 有 可 能 遭 到 攻击 。 








应 | 





有 使 用 SSL 进 



































YAML 模块 提供 了 safe_ load () 方 法 ,在 色 
就 在 加 载 上 进行 了 限制 。 比 如 数据 交换 ， 我 们 
list 对 象 ， 它 们 只 包含 内 置 类 型 。 



































| 建 对 象 的 过 程 
使 用 yaml .safe load() 来 


























会 拒绝 Python 代码 的 执行 。 这 样 
创建 Python 的 qict 条 








， 如 果 没 








中 


























然后 可 以 基于 dict 和 1ist 实例 来 创建 应 | 























程序 中 的 类 。 这 点 








































































































































































































与 使 用 JSON 或 CSV 来 进行 dict 数据 交换 的 方式 是 类 似 的 ， 其 中 qict 用 于 创建 适当 的 对 象 。 
一 个 更 好 的 方式 是 使 用 yaml .YAMLObject mixin 类 来 创建 对 象 。 我 们 使 用 它 来 设置 类 级 别 的 属 
性 , 这些 属 性 为 yaml 提供 一 些 提示 并 确保 对 象 构造 过 程 的 安全 性 .以 下 是 为 安全 传输 而 定义 的 一 个 基 类 。 
class Card2( yaml.YAMLObject ) : 
yaml tag = '!Card2' 
yaml loader= yaml.SafeLoader 
这 两 个 特性 会 提示 yaml， 这 些 对 象 可 被 安全 加 载 , 没有 包含 任意 可 执行 的 、 不 可 预料 的 Python 
代码 。Card2 的 每 个 子 类 只 需 设置 YAML 标签 ， 它 们 也 是 唯一 会 被 用 到 的 。 
class AceCard2( Card2 ) : 
yaml tag = '!AceCard2"' 
我 们 加 入 了 一 个 特性 ， 用 于 提示 yaml 这 些 对 象 只 在 这 个 类 定义 中 使 用 。 这 些 对 象 可 被 安全 加 
载 ， 它 们 不 会 执行 任何 可 疑 的 代码 。 
类 定义 经 过 这 些 修改 后 ， 现 在 就 可 以 在 YAML 流 使 用 yaml . safe load() 方 法 了 ， 而 无 需 担心 
在 不 安全 的 网 络 链接 中 文档 被 注入 了 不 安全 代码 。 为 类 对 象 显 式 地 使 用 yaml .YAMLObject mixin 类 ， 



































并 设置 yaml tad 








的 !AceCarg2 标签 。 


9.6 使 用 pi 


pickle 模块 是 Python 内 部 的 一 种 格式 ， 


属性 会 有 
文件 一 一 看 起 来 长 一 些 














4 是 








些 优 势 。 它 使 得 文件 被 进一步 压缩 
的 ! !python/object :_main 。AceCard 标签 被 






































得 更 紧凑 了 , 也 生成 了 更 美观 的 YAML 





寺 换 成 了 短 一 些 














sm 











并 且 通 用 


ckle 进行 转 储 和 加 载 











j 来 完成 对 象 的 持久 化 。 








| 
/ 

















Python 标准 库 中 是 这 样 描述 pickle 的 : 
pickle 模块 可 以 将 一 个 复杂 的 对 象 转换 为 一 个 字 节 数组 并 且 使 用 相同 的 内 部 结构 将 字 节 流转 换 
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为 一 个 对 象 。 将 这 些 字 节 流 写 入 文件 或 许 是 最 常见 的 场景 ， 但 也 可 能 输出 到 网 络 进行 传输 或 是 数据 库 。 





pickle 所 关注 的 只 有 Python。 它 》 


























者 是 XML， 都 可 用 于 其 




















也 语言 所 编写 的 应 用 。 




























































































不 是 一 种 用 于 数据 转换 的 格式 ， 比 如 JSON、YAML、CSV 或 



























































































































































































































































的 顺序 来 执行 ， 需 要 做 以 下 两 件 寻 









































a 
站 


























@ 避免 在 init _ () 
操作 多 个 文件 ， 当 被 需 





@ 定义 _getstate () 





要 时 才 执 行 。 


和 setstate () 








在 传统 的 Python 代码 ! 

















， 接 下 来 会 使 用 _ 











相同 方法 来 执行 一 次 性 
在 以 下 例子 




















的 初始 化 。 


提前 完成 初始 化 。 相 反 ， 使 用 一 次 性 


setstate () 


， 初 始 化 的 card 实例 被 Hang 对 象 所 加 载 ， 随 后 在 _ 
















































































方法 ， 它 们 可 被 pickle 








初始 化 过 程 。 





方法 调 月 





于 及 it- 






























































pickle 模块 用 很 多 方式 完成 了 与 Python 的 轻 量 集成 。 例 如 ， 一 个 类 的 _reduce () 和 
_reduce ex () 方 法 用 于 提供 对 pickle 处 理 过 程 的 支持 。 

我 们 可 以 使 用 以 下 的 方式 对 博客 执行 pickle 处 理 。 

import pickle 

with open("travel blog.p", "wb") as target: 

pickle.dump( travel, target ) 

以 上 代码 完成 了 整个 上 travel 对 象 到 指定 文件 的 导出 。 文 件 的 写 入 使 用 了 纯 字 节 ， 因 此 open () 
函数 使 用 了 "wb" 模 式 。 

我 们 可 以 使 用 如 下 方式 将 字 节 反 序 列 化 为 对 象 。 

with open("travel blog.p", "rb") as source: 

Copy= pickle.load( source ) 
于 pickle 数据 是 使 用 字 节 写 入 的 ， 文 件 必 须 以 "rb" 模 式 打 开 。pickle 对 象 将 被 正确 地 绑 

定 于 适当 的 类 定义 。 底 层 的 字 节 流 不 是 用 来 直接 读 的 。 必 须 经 过 适当 调整 才 具备 可 读 性 ， 但 设计 它 
的 初衷 不 是 为 了 像 YAML 一 样 可 读 。 
9.6.1 针对 可 靠 的 pickle 处 理 进行 类 设计 

实际 上 , 一 个 类 的 _init __() 方 法 并 不 是 用 来 unpickle 一 个 对 象 的 。 init _() 方 法 可 通过 
使 用 _new _() 来 绕 过 执行 并 直接 将 Pickle 的 值 写 入 对 象 的 _qdict 中 。 当 类 定义 的 _init __() 
中 包含 了 一 些 处 理 逻 辑 时 , 这 一 点 就 很 重要 。 比 如, 当 ”init _() 打开 了 外 部 文件 , 创建 了 一 个 GUI 
接口 中 的 几 个 部 分 ， 或 对 数据 库 执行 了 一 些 修改 ， 那 么 在 unpickling 期 间 这 些 操作 就 不 会 被 执行 

当 在 _init 0 处 理 过 程 中 执行 了 一 个 新 实例 变量 的 计算 逻辑 时 ， 不 会 有 真正 的 问题 。 例 如 ， 在 
21 点 中 ， 当 Hand 被 创建 时 ，Hand 对 象 会 计算 card 实例 的 总 数 。 传 统 的 pickle 处 理 过 程 会 保存 这 个 
经 过 计算 产生 的 实例 变量 。 在 对 象 被 unpickle 之 前 ， 它 不 会 被 重新 计算 ， 只 是 将 之 前 计算 的 值 unpickle。 

如 果 一 个 类 依赖 于 _init __() 的 处 理 逻 辑 ,， 为 了 确保 初始 化 逻辑 被 正确 执行 ， 它 必须 使 用 特定 
































例如 ， 如 果 需 要 




















于 保存 和 还 原状 
有 























所 调用 的 








init _() 











被 写 入 








() 方 法! 
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日 志文 件 用 于 审计 。 这 里 是 一 个 Hang 的 实现 版 本 ， 在 执行 unpickling 时 ， 它 未 能 正常 地 工作 。 








class Hand x: 
def jinit ( self, dealer card, *cards ) : 
self.dealer card= dealer card 
self.cards= list (cards) 
for c in self.cards: 
audit log.info( "Initial %s", c ) 
def append( self, card ) : 
self.cards.append( card ) 
audit log.info( "Hit %s", card ) 
def _ str ( self ): 
cards= ", ".join( mapl(str,self.cards) ) 
return "{self.dealer card} | {cards}".format ( self=self, 
cards=cards ) 


























有 两 个 记录 日 志 的 地 方 : init _() 和 appenqd()。 在 对 象 的 初始 化 和 使 用 unpickling 来 重建 构 
建 对 象 的 两 个 过 程 中 ， init __() 的 行为 是 不 一 致 的 。 如 下 的 日 志 可 以 说 明 这 一 点 。 

















2TTT -二 














Import logging,sys 
audit log= logging.getLogger( "audit" ) 
logging.basicConfig(stream=sys.stderr, level=logging.INFO) 























以 上 实现 创建 了 日 志 并 确保 审计 信息 的 日 志 级 别 是 恰当 的 。 以 下 脚本 简单 地 实现 了 Hand 对 象 
的 创建 ，pickle 和 unpickle。 

















h = Hand x( FaceCard('K','@$'), AceCard('A','®%'), Card('9','yY') ) 
data = pickle.dumps( Ph ) 


h2 = pickle.loads( data ) 


Ik 























执行 这 段 代 码 时 ， 可 以 看 到 在 unpickling Hand 对 象 时 ， 在 ”init _() 的 处 理 过 程 中 , 日 志 
记录 并 没有 被 写 入 。 为 了 适当 地 通过 记录 日 志 达 到 审计 目的 并 用 于 unpickling， 可 以 放 一 些 类 级 别 
的 日 志 。 例 如 ， 可 以 通过 扩展 _getattripbute ()， 当 类 中 的 任何 特性 被 访问 时 记录 一 条 初始 
化 日 志 。 这 会 导致 有 状态 的 日 志 并 且 当 一 个 nand 对 象 每 次 被 操作 都 会 执行 一 次 i£ 语句 。 一 种 更 
好 的 方案 是 ， 对 状态 的 保存 进行 追踪 并 使 用 pickle 来 完成 状态 的 恢复 。 


class Hand2 : 







































































































































































def init ( self, dealer card, *cards ) : 
self.dealer card= dealer card 
self.cards= list (cards) 
for c in self.cards: 
audit log.info( "Initial %s", c ) 
def append( self, card ) : 
self.cards.append( card ) 
audit log.info( "Hit %s", card ) 
def _ str ( self ): 
cards= ", ".join( mapl(str,self.cards) ) 
return "{self.dealer card} | {cards}".format( self=self, 
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cards=cards ) 
def getstate ( self ): 
return self. dict 
def setstate ( self, state ) : 
self. dict .update (state) 
for c in self.cards: 
audit log.info( "Initial (unpickle) %s", c ) 











在 picking 时 ,会 调用 getstate _() 方法 来 获得 对 象 的 当前 状态 。 这 个 方法 可 以 返回 任何 信 
息 。 在 对 象 包含 内 部 缓存 的 情况 下 ， 例 如 ， 为 了 节省 时 间 和 空间 ， 绥 存 可 能 没有 被 pickle。 这 种 实 
现 直 接 重 用 了 内 部 qict 的 实现 。 

当 unpickling 时 ， ”setstate () 方 法 | 
_ qict 中 并 适当 地 记录 一 些 日 志 。 


9.6.2 ”安全 性 和 全 局 性 问题 
在 unpickling 的 过 程 中 , 在 pickle 流 中 的 一 个 全 局 名 称 可 能 会 导致 一 段 自 由 代码 的 执行 。 大 
致 上 ， 全 局 名 称 是 类 名 或 函数 名 。 然 而 ， 也 可 能 在 一 个 模块 的 函数 中 包含 一 个 全 局 名 称 ， 例 如 os 
或 者 是 subprocess。 对 于 没有 严格 的 SSL 控制 的 网 络 环境 ， 当 传输 pickled 对 象 时 ， 应 用 程序 
可 能 会 遭 到 攻击 ， 本 地 文件 完全 不 用 担心 。 
为 了 阻止 自由 代码 的 执行 ,必须 对 pickle .Unpickler 类 进行 扩展 。 我 们 会 使 用 更 安全 的 方 
式 来 重 写 find_class () 方法 。 必 须 考 虑 到 以 下 几 点 unpickling 的 问题 。 
@ 必须 阻止 内 置 的 exec() 和 eval () 函数 的 使 用 
@ 必须 阻止 可 能 会 导致 不 安全 的 模块 和 包 的 使 用 。 例 如 ，sys 和 os 应 当 被 禁用 。 
@ 人 允许 应 用 程序 模块 的 使 用 。 
以 下 是 加 入 一 些 限 制 的 一 个 示例 。 


import builtins 













































































j 于 重 置 对 象 值 。 它 会 将 状态 合并 保存 到 内 部 的 
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class RestrictedUnpickler (pickle.Unpickler): 
def find class(self, module, name): 
if module == "builtins": 
if name not in ("exec", "eval"): 
return getattr (builtins, name) 
elif module == " main ": 
return globals () [name] 
# elif module in any of our application modules... 
raise pickle.UnpicklingError\( 
"global '{module}.{name}' is forbidden".format (module=module, 
name=name)) 
































这 个 版 本 的 Unpickler 类 可 以 帮助 我 们 避免 大 量 潜在 的 问题 ,都 是 由 于 pickle 流 被 算 改 所 导 
致 的 ， 它 允许 使 用 除 exec () 和 eval () 外 的 任何 内 置 函数 。 对 于 自 定义 类 ， 只 人 允许 在 _main 
中 使 用 。 其 他 使 用 情况 则 会 抛 出 异常 。 
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9.7 转 储 和 加 载 CSV 
































csv 模块 将 简单 的 1ist 和 qdict 实例 进 
不 是 一 个 完整 的 持久 化 方案 。 然 而 ， 














json 模块 ， 这 3 
































于 大 量 使 用 

















Python 对 象 和 CSYV 文件 中 的 每 条 记录 间 进 行 转换 。 














行 编码 和 解码 ， 存 入 CSV 格式 。 可 对 于 之 前 讨论 的 
了 CSV 文件 ， 意 味 经 常 需要 在 











在 与 CSV 文件 交互 的 过 程 中 会 需要 在 对 象 与 CSV 结构 之 间 完 成 一 些 映射 。 需要 对 映射 过 程 仔 














MY 

















地 设计 ， 要 考虑 到 CSYV 格式 的 限制 。 由 于 












































间 是 有 很 大 区 别 的 ， 使 得 映射 工作 更 有 难度 。 








一 个 CSV 文件 中 每 列 的 内 容 只 是 纯 文本 。 当 












































将 这 些 值 转换 为 具体 的 类 型 。 
类 型 。 例 如 ,在 一 个 电子 表格 ! 
ZIP 代码 就 可 能 显示 为 看 起 来 奇怪 的 值 。 


对 
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需要 使 
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己 - 
长 
五 
二 
ZI 
Hr CC 














记 
一 | 
4 
忆 
ZI 
































E 同 时 包含 了 ZIP 和 ZIP+4 的 邮 多 
在 更 复杂 的 与 CSV 文件 的 交互 场景 中 ， 必 须 考虑 到 它们 有 时 
了 应 对 非法 操作 ， 灵 活性 对 于 一 个 软件 是 很 重要 的 。 

当 有 了 相对 简单 的 类 定义 ， 可 以 经 常 将 类 实例 转换 为 简 六 














从 一 个 CSV 文件! 














有 高 度 表 达 力 的 对 象 与 表格 格式 的 CSV 文件 记录 之 


加 载 数据 时 ， 需 要 在 应 用 程序 




































































氏 子 表格 做 类 型 转换 的 过 程 可 能 会 很 复杂 ， 医 








为 要 考虑 到 异常 的 

















，US ZIP 代码 被 改 为 了 浮 点 数 。 当 将 这 个 | 
































电子 表格 保存 为 CSV 时 ， 


















































一 种 转换 ， 例 如 使 用 ('00000'+row['zip']) [-5:] 来 还 原 前 面 的 0。 

吏 用 "{:05.0f)jm.format (float (row['zip'])) 来 还 原 前 面 的 0。 另 外 ， 不 要 
前 格式 ， 进 一 步 增加 了 工作 的 挑战 性 。 

于 被 人 为 的 改动 导致 不 再 兼容 。 为 

的 数据 行 。 在 一 个 CSV 源 文件 和 





Python 对 象 之 间 ，namedtuple 是 一 个 很 好 的 选择 。 如 果 应 用 程序 需要 以 CSV 格式 保存 数据 ， 另 











一 种 途径 ， 就 需 








基于 namedtuple 设计 自 



































= 
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要 
如 果 有 一 些 类 ， 它 们 本 身 是 容器 。 通 常 ，} 


第 结 





的 Python 类 。 








是 一 个 阻抗 失 谐 问题 ， 主 要 发 生 在 数据 模型 与 CSV 文件 或 关系 数 扩 





心 * 二 了 














失 谐 问 题 ， 目 前 没有 一 个 很 好 的 方案 ， 它 需要 
始 ， 演 示 一 些 CSV 的 映射 方式 。 





9.7.1 将 简单 的 序列 转 储 为 CSV 


庄 设 计 上 进行 仔细 的 考虑 。 我 介 


构 化 的 容器 表示 为 CSV ! 








库 ， 























的 行 是 很 困难 的 。 这 
的 数据 表 之 间 。 对 于 阻抗 
] 将 以 简单 的 对 象 为 开 




















在 namedtuple 实例 和 CSV 文件 的 行 记 录 之 间 的 映射 是 不 难 的 ， 每 行 表示 了 一 个 不 同 的 





namedtuple， 参 见 如 下 的 Python 类 。 


from collections import namedtuple 


GameStat = namedtuple( "GameStat", 


以 上 定义 了 一 些 对 象 ， 它 们 是 简单 的 属性 序列 。 数 据 库 架构 归 
j 如 下 代码 从 一 个 模拟 器 


limit=100 ) : 


























并 且 每 条 记录 都 是 原子 数据 ， 可 使 | 


def gamestat _ iter( player, 














betting, 
for sample in range (30): 














"player,bet,rounds,final" ) 





























j 称 为 第 一 范式 。 没 有 重复 的 记录 
创建 这 些 对 象 。 











9.7 转 储 和 加 载 CSV 201 


b = Blackjack( player(), betting() ) 

b.until broke or rounds (Limit) 

yield GameStat( player. name , betting. name , b.rounds, 
b.betting.stake ) 


这 个 迭代 器 将 创建 21 点 模拟 器 ， 包 括 了 一 个 玩家 和 下 注 策略 。 它 将 持续 运行 ， 直 到 玩家 破 
产 或 玩 了 100 个 回合 。 每 个 回合 结束 ， 将 返回 一 个 GameStat 对 象 ， 其 中 包含 了 玩家 策略 、 下 注 
策略 、 回 合 数 以 及 最 后 的 底 金 。 可 以 使 用 这 个 对 象 来 对 每 次 游戏 、 下 注 策略 或 组 合 的 情况 进行 统 
计 计 算 。 以 下 是 将 统计 结果 写 入 文件 的 代码 实现 ， 之 后 可 用 于 分 析 。 











































































































import csv 








with open("blackjack.stats","w",newline="") as target: 
writer= csv.DictWriter( target, GameStat. fields ) 
writer.writeheader () 


for gamestat in gamestat iter( Player Strategy 1, Martingale Bet 


WE er eilerow( ganest et aodice ty 

创建 一 个 CSV writer 需要 以 下 3 个 步 又。 

1. 以 newline 选项 (赋值 为 ") 打开 一 个 文件 。 这 是 为 了 文 持 〈 可 能 ) CSV 文件 中 非 标准 的 行 。 

2. 创建 一 个 csV writer 对 象 。 在 这 个 例子 中 ， 我 们 创建 了 Dictwriter 实例 ， 可 以 用 来 

从 字典 对 象 中 简单 地 创建 行 。 

3. 在 文件 的 第 1 行 设置 标题 。 这 样 可 以 通过 为 CSV 文件 中 的 记录 提供 一 些 提示 来 简化 数据 
交换 的 操作 。 

旦 创建 好 了 writer 对象， 就 可 以 使 用 writer 中 的 writerow () 方法 将 字典 写 入 CSV 文 

件 中 。 出 于 扩展 的 目的 ， 可 使 用 writerows () 方法 来 简化 实现 。 这 个 方法 将 接收 一 个 迭代 器 而 不 

是 独立 的 行 ， 以 下 是 如 何 使 用 迭代 器 调用 writerows () 方法 的 示例 。 
















































































































































































data = gamestat iter( Player Strategy 1, Martingale Bet ) 

with open("blackjack.stats","w",newline="") as target: 
writer= csv.DictWriter( target, GameStat. fields ) 
writer.writeheader () 








writer.writerows( g. asdict() for g in data ) 
将 迭代 器 赋值 给 了 一 个 gata 变量 。 为 writerows () 方 法 提供 一 个 字典 ， 它 的 每 行 记录 都 来 
自 于 迭代 器 。 





9.7.2 从 CSV 文件 中 加 载 简单 的 序列 
可 以 从 一 个 CSV 文件 加 载 简单 的 序列 对 象 ， 如 下 面 代码 所 示 ， 使 用 一 个 循环 来 完成 加 载 过程 。 



































with open("blackjack.stats","r",newline="") as Source : 
reader= csv.DictReader( source ) 
for gs in ( GameStat (**r) for r in reader ) : 
print( gs ) 
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我 们 为 文件 定义 了 一 个 reager 对 象 。 如 我 们 所 看 到 的 ， 文 件 中 包含 了 标题 ， 














DictReader。 这 样 就 会 使 用 第 1 行 来 定义 属性 名 称 。 现 在 可 以 使 / 























对 象 。 我 们 使 用 了 一 个 生成 器 表达 式 来 创建 行 。 






































人 











过 对 比 reader.fieldnames 和 GameStat.fields 来 人 























在 这 种 情况 下 ， 我 们 假设 列 名 与 GameStat 类 中 定义 的 忆 





jj CSYV 文件 
































可 以 使 用 
的 行 来 构造 GameStat 












































一 致 ， 因 此 可 以 将 每 个 成 员 名 称 列表 转换 为 一 个 集合 。 以 下 是 我 们 检查 列 名 的 操作 。 


assert set (reader.fieldnames) == set (GameStat. fieldqs) 








我 们 忽略 了 从 文件 中 所 读 取 记录 的 类 型 。 当 读 取 CSV 文 伯 
字符 串 来 对 待 。 为 了 创建 正确 的 数据 ， 就 需要 引入 更 复杂 的 行 到 行 的 转换 机 制 。 以 下 是 一 个 典型 的 























工厂 函数 ， 用 于 完成 数据 转换 。 


def gamestat iter(iterator): 


for row in iterator: 








yield GameStat( row['player'], rowl['bet'], int(row['rounds']), 


int (row['final']) ) 


我 们 将 int 函数 应 用 于 了 一 些 数 字 列 。 一 个 文件 中 不 该 有 正确 
我 们 将 从 一 个 失败 的 int () 函数 中 得 到 一 个 普通 的 ValueError 错误 对 象 。 可 以 像 下 面 这 样 使 用 












































性 名 是 匹配 的 。 如 果 必 要 ， 可 以 通 


上 定 文件 格式 是 所 期 望 的 。 由 于 顺序 不 必 


时， 两 个 数字 列 的 值 最 终 将 被 当 


| 




















作 


的 标题 却 对 应 了 错误 的 数据 ， 





with open("blackjack.stats","r",newline="") as source: 


reader= csv.DictReader( source ) 


assert set (reader.fieldnames) == set (GameStat. fields) 


for gs in gamestat iter (reader): 
print( gs ) 
































在 这 个 版 本 的 reager 中 , 由 于 执行 了 适当 的 数值 类 型 的 转换 , 从 而 正确 地 创建 了 GameStat 对 象 。 
































9.7.3 ”处 理 集合 与 复杂 的 类 


























格式 的 映射 。 我 们 有 3 种 常见 的 方案 。 


























@ 我们 可 以 创建 两 个 文件 : 博客 和 文章 。 博 客 文件 中 只 有 








于 哪 篇 文章 。 我 们 需要 为 每 个 Blog 都 添加 一 个 键 。 
为 对 Blog 键 的 引用 。 

















个 Blog 有 一 个 标题 。 每 个 Post 的 行 包含 了 一 个 对 




















回顾 一 下 博客 的 例子 ， 我 们 有 一 个 Blog 对 象 ， 包 含 了 许多 Post 实例 。 在 示例 中 ，] 
list 的 封装 ， 因 此 Blog 将 包含 一 个 集合 。 当 与 CSV 记录 交互 时 ， 就 必须 设计 从 复杂 结 


一 口 


Blog 实例 。 在 我 们 的 例子 中 ， 








Bl 











Blog 为 


构 到 表格 


























og 行 的 引用 ， 用 于 表示 这 一 行 
每 个 Post 就 可 以 包含 一 个 外 键 ， 





® 我 们 可 以 在 一 个 文件 中 创建 两 种 行 ， 包 括 Blog 行 和 Post 行 。writer 负责 将 不 





数值 类 型 混合 在 一 起 写 入 文件 ，readet 在 读 取 时 将 不 同 数据 的 类 型 分 开 。 















































证 洱 怕 





可 


@ 我们 可 以 通过 使 用 关系 数据 库 中 的 连接 在 不 同类 型 的 行 数据 之 间 建 立 关 系 ， 在 每 个 Post 











| 由 


的 子 记 录 中 





E 复 Blog 的 父 记录 。 











9.7 转 储 








和 加 载 CSV 203 





在 以 上 方案 中 ， 不 存在 最 优 方案 。 必 须 设 计 一 种 方案 能 够 解决 在 CSV 文件 ! 





























Python 对 象 之 间 的 阻抗 不 匹配 问题 ， 这 些 数 据 的 用 例 将 产生 一 些 优点 和 缺点 。 





创建 两 个 文件 的 同时 为 每 个 Blog 创建 唯一 标识 ， 这 样 就 使 得 一 个 Post 可 以 正确 地 引用 
Blog。 不 能 使 用 Python 内 部 的 ID， 因 为 在 每 次 Python 运行 后 它们 并 不 能 保证 一 致 性 。 























的 行 与 结构 化 的 
























































一 个 常见 的 做 法 是 使 用 Blog 标题 作为 唯一 的 键 值 ， 因 为 它 是 Blog 的 一 个 属性 ， 可 看 作 是 天 


























然 的 主键 。 这 种 方案 也 不 是 有 效 的 ， 我 们 无 法 在 不 更 新 所 有 引用 自 Blog 的 Posts 


Se 




































































可 使 用 Python 中 的 uuia 模块 来 提供 唯一 标识 。 














Blog 的 标题 进行 更 新 。 一 种 更 好 的 做 法 是 创建 唯一 标识 并 在 类 定义 中 包含 它 ， 这 称 为 代理 主键 。 





的 同时 ， 对 一 个 




























































































过 





适当 的 主键 。 一 旦 定义 了 键 值 , 就 可 以 使 用 之 前 看 到 的 writer 和 reader 来 处 理 
的 Blog 和 Post 实例 。 


9.7.4 在 一 个 CSV 文件 中 转 储 并 从 多 类 型 的 行 中 加 载 数据 


在 一 个 文件 中 创建 多 种 类 型 的 行使 得 格式 更 复杂 了 。 需 要 将 所 有 可 用 罗 



















































































接 调 用 csv .DictReader 的 方式 ; 或 者 创建 复杂 的 标题 ， 将 类 与 属性 名 结合 。 



































使 用 多 个 文件 的 代码 实现 与 之 前 的 例子 几乎 是 相同 的 。 唯一 区 别 就 是 在 Blog 类 中 添加 了 一 个 
与 不 同文 件 交 互 


的 标题 合成 为 一 个 束 
体 。 由 于 在 不 同行 类 型 之 间 存在 命名 冲突 ， 对 行进 行 访问 时 ， 要 么 通过 位 置 一 -会 阻止 我 们 直 














如 果 每 行使 用 另外 一 列 存 放 类 修饰 符 的 话 ， 操作 起 来 就 会 容易 些 。 这 个 附加 列 会 告诉 我 们 这 行 
对 象 对 应 哪 种 类 型 。 这 列 存 放 对 象 的 类 名 就 可 以 了 。 以 下 代码 演示 了 如 何 将 CSV 文件 ! 




















行 格式 的 记录 写 入 博客 和 文章 。 





with open("blog.csv","w",newline="") as target: 
wtr.writerow([' _ class ','title','date','title','rst 
text', 'tags']) 
wtr= csv.writer( target ) 
for. Db. n BLOgS: 
wtr.writerow(['Blog',b.title,None,None,None, None]) 
for p in b.entries: 
wtr.writerow(['Post',None,p.date,p.title,p.rst text,p. 
tags]) 


我 们 基于 文件 中 的 行 创建 了 两 个 变量 。 一 些 行 的 第 1 列 包 含 了 'Blog'， 并 只 
象 的 属性 。 另 一 些 行 的 第 1 列 含 有 'Post ' 并 仅 包含 Post 对 象 的 属性 。 
我 们 并 没有 将 标题 设 为 是 唯一 的 ， 因 此 不 能 使 用 dictionary reader。 当 























































































































两 种 不 同 


包含 有 Blog 对 





像 这 样 来 分 配 列 




















的 位 置 时 ， 由 于 其 他 类 型 行 的 存在 ， 每 行 有 一 些 列 是 没有 被 用 到 的 。 这 些 列 将 被 寺 






































充 为 None。 随 























着 越 来 越 多 不 同行 类 型 的 引入 ， 管 理 不 同位 置 列 的 分 配 是 一 项 很 有 挑战 的 工作 。 
另外 ， 个 别 的 数值 类 型 转换 显得 有 些 奇 怪 。 特 别 是 ， 我 们 忽略 了 timestamp 
我 们 可 以 通过 验证 每 行 的 修饰 符 来 重新 整合 Blogs 和 Posts。 



















































































with open("blog.csv","r",newline="") as source: 


rdr= csv.reader( source ) 


和 tags 类 型 。 
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header= next (rdr) 


assert header == [' Cclass ','title','date','title','rst 
text', 'tags'] 
blogs = [] 
for r ‘in rdr: 
if r[0] == 'Blog': 


blog= Blog( *r[1:2] ) 
blogs.append( blog ) 

if r[0] == "Post': 
post= post builder( r ) 
blogs[-1] .append( post ) 


这 段 代码 将 创建 一 个 Blog 对 象 的 列表 。 每 个 'Blog' 的 行使 用 了 splice (1,2) 中 的 列 来 定义 Blog 
对 象 。 每 个 'Post ' 行 使 用 了 splice (2, 6) 中 的 列 来 定义 一 个 Post 对 象 。 这 需要 每 个 Blog 正确 地 对 
应 了 相关 的 Post 实例 ， 仅 仅 使 用 一 个 外 键 并 不 能 将 两 个 对 象 关联 在 一 起 。 

我 们 假设 在 CSV 文件 中 的 列 和 类 构造 器 参数 的 类 型 具有 相同 顺序 。 对 于 Blog 对 象 ， 我 们 使 
用 了 blog=Blog( *r[1:2] )， 因 为 one-and-only 列 是 文本 ， 与 类 构造 器 是 匹配 的 。 当 与 外 部 提 
供 的 数据 一 起 工作 时 ， 这 个 假设 可 能 就 不 成 立 了 。 

为 了 创建 Post 实例 ， 我 们 使 用 了 一 个 单独 的 函数 来 完成 从 列 到 类 构造 器 的 映射 。 这 里 是 映射 函数 。 


import ast 
def builder( row ) : 


return Post ( 



























































































































































dqate=qatetime .datetime.strptime (Tow[2]，" 当 Y-g%m-gsq %H:%M:%S"), 
title=row[3], 

rst text=row[4], 

tags=ast.literal eval (row[5]) ) 














以 上 代码 会 基于 文本 行 正确 地 创建 一 个 Post 实例 。 它 将 datetime 文本 和 标签 的 文本 转换 
为 了 相应 的 Python 类 型 ， 它 的 优势 是 显 式 地 完成 映射 。 

在 这 个 例子 中 ， 我 们 使 用 ast .1iteral eval () 来 对 Python 中 更 复杂 的 文本 值 进行 解码 。 
允许 CSV 数据 中 包含 一 组 字符 串 值 组 成 的 元 组 :" ('#RedRanger'，, '#Whitby42', '#ICW')"。 


9.7.5 ”使 用 迭代 器 第 选 CSV 中 的 行 


J 以 对 之 前 的 加 载 示例 代码 进行 重 构 ， 对 Blog 对 象 进行 迭代 而 不 是 返回 Blog 对 象 组 成 的 列 
表 。 这 样 一 来 , 当 浏览 一 个 很 大 的 CSV 文件 时 , 只 需 查 找 相关 的 Blog 和 Post 的 行 记录 就 可 以 了 。 
这 个 函数 是 一 个 生成 器 ， 会 分 别 返 回 每 个 Blog 实例 。 


def blog iter(source): 
































| 















































rdr= Csv.reader( source ) 

header= next (rdr) 

assert header == [' class ','title','date','title','rst 
text', 'tags'] 

blog= None 


EOF EE 1 EAr: 
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if r[0] == 'Blog': 

if blog: 

yield blog 

blog= Blog( *r[1:2] ) 
if r[0] == "Post': 

post= post builder( r ) 

blog.append( post ) 

ee 有 

yield blog 








这 个 blog_iter () 函数 创建 了 Blog 对象 并 附加 了 Post 对 象 。 每 当下 一 个 Blog 表 头 出 现时 ， 
之 前 的 Blog 就 算 完成 了 并 且 返 回 。 最 终 ，Blog 对 象 也 需要 被 返回 。 如 果 我 们 需要 那个 很 大 的 Blog 
实例 列表 ， 可 以 使 用 如 下 这 段 代 码 。 


















































with open("blog.csv","r",newline="") as Source : 


blogs= list( blog iter (source) ) 


























以 上 代码 会 使 用 迭代 器 来 创建 一 个 Blogs 列表 ， 在 很 少 情况 下 我 们 会 需要 用 到 内 存 中 整个 序列 。 
可 使 用 如 下 代码 来 分 别 对 每 个 Blog 进行 处 理 并 创建 RST 文件 。 















































with open("blog.csv","r",newline="") as Source : 
for b in blog iter (source) : 
with open (blog.title+'" .rst', 'w') as rst file: 
render( blog, rst file ) 








我 们 使 用 了 blog_iter () 函数 来 读 取 每 篇 博客 。 每 次 读 完 ， 都 可 以 使 用 RST 格式 的 文件 
来 表示 。 可 使 用 另 一 个 进程 通过 运行 rst2html.py 来 将 每 篇 博客 转换 为 HTML 格式 。 

我 们 可 以 简单 地 通过 添加 一 个 过 滤器 来 做 到 只 处 理 选 中 的 Blog 实例 。 可 以 添加 一 个 if 语句 
来 决定 哪些 Blogs 需要 演 染 ， 而 不 是 演 染 全 部 。 


9.7.6 从 CSV 文件 中 转 储 和 加 载 连接 的 行 


将 所 有 对 象 连 接 起 来 意味 着 每 行 是 一 个 与 所 有 父 对 象 连接 的 子 对 象 , 这 样 会 导致 父 对 象 的 属性 
在 每 个 子 对 象 是 重复 的 。 如 果 有 多 个 级 别 的 容器 ， 会 导致 大 量 的 重复 数据 。 

重复 带 来 的 优势 是 每 行 是 独立 的 ， 并 且 不 依赖 于 上 下 文 ， 这 个 上 下 文 是 基于 在 它 上 面 的 行 来 定 
义 的 。 并 不 需要 使 用 一 个 类 修饰 符 来 存放 父 对 象 的 值 ， 这 些 值 在 每 个 子 对 象 中 都 存在 。 

这 种 方式 对 于 简单 层次 结构 的 数据 是 可 行 的 ， 每 个 子 对 象 中 添加 了 一 些 父 对 象 的 属性 。 当 数 
据 涉 及 更 复杂 的 关系 时 ， 简 单 的 父子 结构 就 不 适用 了 。 在 这 些 例子 中 ， 我 们 使 用 文本 中 单独 的 
列 来 集中 放置 Post 标签 。 如 果 希 望 将 标签 分 散 到 不 同 的 列 中 ,它们 将 成 为 每 个 Post 的 子 对 象 ， 
意味 着 Post 文本 会 在 每 个 tag 中 重复 。 显 然 ， 这 种 方式 更 好 一 些 。 
列 标题 必须 将 所 有 可 用 的 列 标题 进行 合成 。 由 于 在 不 同行 之 间 的 命名 冲突 是 有 可 能 存在 的 ， 我 
们 会 使 用 类 名 来 作为 列 名 。 列 标题 可 能 会 是 'Blog .Title' 和 'Post .title'， 这 样 就 避免 了 命 
名 冲突 。 这 种 机 制 也 允许 使 用 DictReader 和 Dictwriter， 而 不 是 根据 位 置 分 配 列 名 。 然 而 ， 
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这 些 列 名 并 不 会 进一步 完成 类 定义 中 属性 名 称 的 匹配 ,这 导致 了 解析 标题 的 过 程 需 要 更 多 的 文本 处 


理 来 完成 。 以 下 代码 演示 了 如 何 将 已 经 连接 了 父 对 象 和 子 对 象 及 其 属性 的 行 写 入 文件 。 
























































with open("blog.csv","w",newline="") as target: 
wtr= csv.writer( target ) 
wtr.writerow(['Blog.title', 'Post.date', 'Post.title', "Post. 
tags', 'Post.rst text']) 
for b in blogs: 
for p in b.entries: 
wtr.writerow([b.title,p.date,p.title,p.tags,p.rst text]) 


以 上 实现 包含 适当 的 列 标题 。 在 这 种 格式 中 ， 每 行 包含 了 Blog 属性 与 Post 属性 合成 后 的 结 
果 。 这 种 结构 更 容易 构造 ， 因 为 不 需要 将 不 需要 的 列 填充 为 None。 由 于 每 列 的 名 称 是 唯一 的 ， 攻 
此 可 以 很 方便 地 使 用 Dictwriter。 以 下 这 种 方式 基于 CSV 行 的 输入 对 原 容 器 进行 了 重新 构造 。 











































































































def blog iter2 ( Source ) : 
rdr= csv.DictReader( source ) 
assert set (rdr.fieldnames) == set (['Blog.title','Post.date','Post. 
title', ‘Post.tags', 'Post.rst text']) 
row= next (rdr) 
blog= Blog (row['Blog.title']) 
post= post builder5( row ) 
blog.append( post ) 
for row in rdr: 
if row['Blog.title'] != blog.title: 
yield blog 
blog= Blog( row['Blog.title'] ) 
post= post builder5( row ) 
blog.append( post ) 
yield blog 


数据 的 第 1 行 用 于 创建 一 个 Blog 实例 以 及 Blog 中 的 第 1 个 Post 对 象 。 在 循环 中 ， 不 可 变 


条 件 会 假设 存在 一 个 适当 的 Blog 对 象 。 一 个 有 效 的 Blog 实例 使 得 逻辑 更 简化 了 。Post 的 实例 
是 使 用 以 下 这 个 函数 创建 的 。 


import ast 
def post builder5( row ) : 
return Post ( 
date=datetime.datetime.strptimel( 
row['Post.date'], "%Y-%m-%d %H:SM:%$S"), 
























































title=row['Post.title'], 
rst text=row['Post.rst text'], 
tags=ast.literal eval (row['Post.tags']) ) 


我 们 对 每 行 中 的 每 列 都 进行 映射 ， 这 个 映射 将 每 一 列 转 换 为 类 构造 器 的 参数 。 这 使 得 所 
有 的 转换 都 是 显 式 进行 的 。 它 很 好 地 完成 了 从 CSYV 文本 到 Python 对 象 的 类 型 转换 。 

我 们 可 能 希望 将 Blog 生成 器 重 构 为 一 个 单独 的 函数 。 然 而 ， 这 并 没有 完全 遵从 DRY 原则 ， 可 对 
于 这 么 小 的 功能 来 说 似乎 过 于 挑剔 了 。 因 为 列 标题 匹配 了 参数 名 ， 所 以 可 以 使 用 如 下 代码 来 生成 对 象 。 
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def make ob]j( row, class =Post, prefix="Post" ) : 


column split = ( 
kw args = dictl( 


for key,classname,attr in column split if 


classname==prefix ) 


return class( 














这 里 使 用 了 两 个 表达 式 生成 器 。 第 1 个 表达 式 生 成 器 将 列 名 解析 为 类 和 






















































































**kw args ) 





























(k,)+tuple(k.split('.')) for k in row ) 
(attr,row[key]) 



































































































































属性 ， 并 创建 了 三 元 组 ， 


包括 全 键 、 类 名 和 属性 名 。 第 2 个 表达 式 生 成 器 对 目标 类 进行 了 筛选 ， 它 使 用 属性 和 键 值 对 创建 了 
一 个 二 元 组 的 序列 ， 可 用 于 创建 字典 。 

这 并 没有 解决 Posts 的 数据 转换 问题 。 每 个 列 的 映射 操作 还 没有 统 当 将 其 与 
post_builder5 () 函数 对 比 时 ， 添 加 更 多 处 理 逻 辑 并 不 会 有 太 大 作用 。 

空 文件 的 情况 并 不 是 很 常见 具有 一 个 标题 行 但 是 包含 0 条 Blog 记录 一 一 初始 化 表达 式 
row=next (rdr) 将 导致 一 个 stopIteration 异常 。 由 于 这 个 异常 并 没有 在 生成 器 函数 中 被 处 
理 ， 它 将 冒 泡 进入 blog_iter2 () 的 循环 中 ， 这 个 循环 最 后 将 终止 执行 。 



































9.8 使 用 XML 转 储 和 加 载 














Python : 














象 与 XML 文档 之 间 的 转换 经 常会 发 生 。 












































XML 文件 的 处 理 涉及 对 象 与 XML 结构 之 间 的 映 和 














要 考虑 到 XML 格式 存在 的 一 些 约束 。 





1 于 在 表达 力 强 日 




















有 很 大 区 别 ， 导 致 了 映射 复杂 度 的 增加 。 













































































| 


考虑 





长 

















了 XML 文档 中 。 
使 用 
示 为 文本 。 
































能 会 包括 一 些 





生成 XML 文档 。 和 之 前 的 





json 模块 一 村 

















于 XML 文 伯 





























时 处 性 
的 对 象 与 XML 











属性 或 标签 ， 


F 格 式 的 普遍 使 用 














E。 在 设计 映射 的 时 候 需 要 很 谨 





文档 严格 的 




















的 xml 包 中 包含 了 很 多 用 于 解析 XML 文件 的 模块 ， 也 包括 一 个 文件 对 象 模型 
(Document Object Model，DOM) 的 实现 ， 可 用 了 
并 不 是 一 个 完整 的 对 Python 对 象 持久 化 的 方案 。 然 而 ， 


，Python 对 




















层次 性 结构 之 | 











声明 所 期 望 的 类 型 。 
plist1Lib 模块 将 一 些 Python 中 内 置 的 结构 转换 为 























寺 久 化 ”! 











xml .etree.ElementTree 创建 Eleme 


对 这 个 模块 进行 探究 ,可 用 





为 了 支持 自 定义 类 , json 模块 中 提供 了 一 些 对 JSON 编码 进行 扩 
展 的 方法 ，plist1lib 模块 并 没有 提供 这 个 功能 。 








将 一 个 Python 对 象 转 储 为 XML 文档 时 ， 以 下 有 3 种 常用 的 方式 可 | 
在 类 设计 中 包括 XML 输出 方法 。 通 过 使 用 这 利 



































ntTree 节点 3 


且 返 回 





已 来 加 载 配 置 文件 。 


] 


j 来 创建 文本 。 
方法 ， 我 们 的 类 生成 的 字符 串 就 直接 进入 





二 
< TT 


间 


属性 或 标签 的 内 容 是 纯 文 本 。 当 加 载 一 个 XML 文档 时 ， 我 们 需要 将 这 些 值 转换 为 应 用 
。 在 一 些 情况 下 ，XML 文档 中 可 

如 果 要 将 这 些 限 制 都 考虑 进来 ， 可 以 使 
XML 文档 。 我 们 会 在 第 13 章 “ 配 置 文件 和 





这 个 结构 。 这 可 被 表 
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@ ”使 用 一 个 外 部 的 模板 并 将 属性 写 入 模板 中 。 除 非 我 们 已 经 有 了 一 个 很 复杂 的 模板 工具 ， 否 
则 这 种 方法 并 不 是 很 推荐 。string .Template 类 在 标准 库 中 只 适用 于 非常 简单 的 对 象 。 

有 时 会 需要 在 Python 中 创建 通用 的 XML 序列 化 器 。 创 建 一 个 通用 的 序列 化 器 的 问题 在 于 ，XML 
结构 非常 灵活 。 每 个 应 用 的 XML 都 需要 有 唯一 的 XML 模式 定义 (XML Schema Defination，XSD) 
或 文档 类 型 定义 (Document Type Defination，DTD) 。 

一 个 普遍 的 设计 问题 是 如 何 对 一 个 原子 值 进行 编码 。 可 以 使 用 很 多 种 方式 达到 目的 。 可 以 在 标 
签 的 属性 上 使 用 一 个 可 以 标识 类 型 的 标签 。 另 一 个 方式 是 将 类 型 放 在 type 标签 里 : <the_answer 
type="int">42</the_answer> 。 我 们 也 可 以 使 用 秽 套 的 标签 : <the answer><int>42 
</int></the answer>。 或 者 ， 可 以 依赖 于 模式 定义 中 的 描述 ， 建 议 the_answer 应 该 为 一 个 整数 3 
尽量 不 要 编码 为 文本 : <the_answer>42</the_answer>。 也 可 以 使 用 邻接 的 标签 : <key>the_ 
answer</key><int>42</int>。 以 上 并 不 是 所 有 的 方案 ，XML 还 提供 了 很 多 其 他 的 方式 。 

当 从 XML 文档 中 读 取 记录 并 创建 Python 对 象 时 ， 我 们 被 API 的 解析 器 限制 了 。 一 般 地 ,我 们 
需要 对 文档 进行 解析 ， 然 后 检查 XML 标签 的 结构 ， 最 后 使 用 有 效 数据 创建 Python 对 象 。 

有 一 些 Web 框架 , 例如 Django， 包括 了 Django 中 定义 的 类 的 序列 化 操作 。 它 与 一 般 的 Python 
对 象 的 序列 化 是 有 区 别 的 。 序列 化 的 定义 由 Django 中 的 数据 模型 组 件 完 成 。 另 外 , 还 定义 了 dexml、 
lxml 和 pyxser 这 些 用 于 Python 对 象 和 XML 之 间 绑 定 的 包 。 可 参见 http://pythonhosted.org/ 
dexmlapi/dexmlhtml、http:Wlxml.de 和 http://coder.cl/products/pyxser/。 这 里 还 有 一 个 更 详细 的 列表 : 
https://wiki.python.org/moin/PythonXml。 


9.8.1 使 用 字符 串 模板 转 储 对 象 

将 Python 对 象 序列 化 为 XML 的 一 种 方式 是 创建 XML 文本 。 这 也 是 手动 映射 的 一 种 ,通常 由 一 个 
映射 函数 来 完成 ， 它 会 生成 Python 对 象 所 对 应 的 XML。 如 果 有 一 个 复杂 的 对 象 ， 容 器 必须 遍历 其 中 的 
每 一 项 。 以 下 是 对 我 们 微 博 类 结构 的 两 种 简单 的 扩展 方式 ， 添 加 了 将 XML 输出 为 文本 的 功能 。 








































































































rp 

































































































































































































































































































































































class Blog X( Blog ) : 
def xml( self ): 


children= "\n".join( c.xml() for c in self.entries ) 
return """\ 

<blog><title>{0.title}</title> 

<entries> 

{1} 

<entries></blog>""".format (self, children) 


class Post X{( Eost }: 
def xml( self ): 
tags= "".join( "<tag>{0}</tag>".format (t) for 七 in self.tags ) 
return nN 
<entry> 
<title>{0.title}</title> 
<date>{0.date}</date> 
<tags>{1}</tags> 


这 种 方式 还 不 够 一 般 化 ,1 
些 记 录 。Post Xx.xml () 方 法 输出 了 一 个 <post> 标 签 ， 其 中 包含 了 一 些 





<text>{0.rst text}</text> 
</entry>""".format (self,tags) 


以 上 XML 输出 方法 的 实现 





9.8 使 用 























有 非常 高 的 类 的 特殊 性 , 它 会 输 
Blog_X.xml () 方 法 生成 了 一 个 <blog> 标 签 , 包含 了 一 个 标题 和 一 
属性 。 在 这 两 种 方法 中 ， 























HH XML 中 包含 的 相关 属性 。 


XML 转 储 和 加 载 209 














使 用 了 "" .join() 或 "\n" .join() 来 创建 附属 对 象 ， 后 者 基于 短 字符 串 元 素 创 建 一 个 长 字符 


串 。 





将 一 个 Blog 对 象 转换 为 XML 可 能 


<blog><title>Travel</title> 


<entries> 


<entry> 











1 下 所 示 。 


<title>Hard Aground</title> 


<date>2013-11-14 17:25:00</date> 


tags> 


</entry> 
<entry> 


<title>Anchor Follies</title> 
<date>2013-11-18 15:30:00</date> 


tag></tags> 





</entry> 
<entries></blog> 


这 种 方式 有 两 个 缺陷 。 























。 每 个 类 





忽略 了 XML 命名 空间 ， 还 需 稍微 对 文本 进行 改动 来 4 
还 需要 适当 地 将 <、&&、> 和 “” 字 符 相 应 地 转 义 为 XML 1" 


<text>Some witty epigram.</text> 

















的 





<tags><tag>#RedRanger</tag><tag>#Whitby42</tag><tag>#ICW</tag></ 


<text>Some embarrassing revelation. Including @and VY </text> 


<tags><tag>#RedRanger</tag><tag>#Whitby42</tag><tag>#Mistakes</ 


E 成 相应 的 标签 。 


&lt;、 &gt;、 &amp; 


和 &quot;。html 模块 中 的 html .escape () 函数 可 以 完成 这 类 转换 。 


这 种 方式 可 以 生成 XML， 它 虽 能 够 有 效 执行 但 3 









































不 是 很 优雅 而 

















9.8.2 ”使 用 xml.etree.ElementTree 转 储 对 象 


对 它 使 用 
每 个 元 素 。 
需要 先 创建 文档 然后 对 文档 ， 
大 体 上 来 说 , 希望 在 设计 的 每 个 类 中 创建 

















我 们 可 以 使 用 

















Xml .etree. 


xml .dom 和 xml .m 















































inidom 





当 对 一 个 包含 了 一 些 属性 的 类 进行 序列 化 时 ， 上 下 文 对 象 的 H 


ElementTree 模块 来 创建 1 











并 不 是 很 容易 。DOM API 需要 拿 到 最 | 











不 够 通用 。 


Element 结构 ， 























它 用 于 生成 XML。 
上 层 的 文档 , 然后 创建 

















现 就 显得 有 些 复杂 。 我 们 

















的 所 有 元 素 序列 化 ， 将 文档 上 下 文 作为 一 个 参数 传 入 。 






































个 最 上 层 元 素 并 返 

















回 。 最 上 层 元 素 将 包含 一 个 子 元 














素 的 序列 ， 可 以 将 文本 和 属性 赋值 给 需要 创建 的 每 个 元 素 ， 也 可 以 将 一 个 以 结束 标签 为 结尾 的 外 部 
文本 赋值 为 tail。 对 于 内 容 模 板 而 言 ， 这 只 是 空格 。 对 于 长 的 名 称 来 说 ， 以 如 下 方式 来 导入 
ElementTree 可 能 会 方 便 些 。 
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import Xml .etree.ElementTr as XML 





























这 里 是 两 种 对 微 博 类 结构 的 扩展 实现 , 都 是 将 XML 输出 的 功能 加 入 Element 实例 中 , 在 Blog 
类 中 添加 了 如 下 方法 。 


def xml( self ): 
blog= XML .ELement ( "blog" ) 
title= XML.SubElement ( blog, "title" ) 
title.text= self.title 
title.tail= "\n" 
entities= XML.SubElement ( blog, "entities" ) 
entities.extend( c.xml() for c in self.entries ) 
blog.tail= "\n" 
return blog 


























在 Post 类 中 添加 了 如 下 方法 。 


def xml( self ) : 
post= XML.Element( "entry" ) 
title= XML.SubElement ( post, "title" ) 
title.text= self.title 
date= XML .SubElement ( post, "date" ) 
date.text= str(self.date) 
tags= XML .SubElement ( post, "tags" ) 
for t in self.tags: 
tag= XML.SubElement( tags, "tag" ) 
tag.text= 七 
text= XML .SubElement ( post, "st text" ) 
text .text= self.rst text 
Post .tail= "\n" 





























return post 











以 上 XML 输出 的 实现 在 类 级 别 具 有 高 度 的 抽象 。 它 们 将 创建 包含 适当 文本 值 的 Element 对 象 。 











本 在 创建 子 元 素 的 工作 中 ， 没 有 方便 快速 的 方式 。 我 们 必须 分 别 插 


在 pblog 方法 中 ,可 以 使 用 Element .extend () 来 将 每 个 文章 记录 放 进 <entry> 元 素 中 。 这 
使 得 创建 XML 结构 的 工作 灵活 而 简便 。 这 一 切 都 需要 归功 于 XML 命名 空间 。 我 们 可 以 使 用 QName 
类 来 为 XML 命名 空间 定义 适当 的 名 称 。ElementTree 模块 正确 地 对 XML 标签 应 用 了 命名 空间 得 
选 器 。 这 种 方式 也 正确 地 将 <、&&、> 和 "字符 转换 为 XML 中 的 glt;、&gt;、&amp; 和 &quot;。 
这 些 方法 中 大 部 分 输出 的 XML 都 会 匹配 上 一 节 的 内 容 ， 而 空格 会 不 同 。 


9.8.3 ”加载 XML 文档 
从 一 个 XML 文档 中 加 载 Python 对 象 分 为 两 步 。 首 先 ， 我 们 需要 对 XML 文本 解析 ， 用 于 创建 
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文档 对 象 。 然 后 ， 需 要 对 用 于 生成 Python 对 象 的 文档 对 象 进行 检查 。 正 如 前 面 所 介绍 的 ，XML 格 


式 





























具有 极 大 的 灵活 性 ， 从 XML 到 Python 的 序列 化 方法 并 不 是 唯一 的 。 


























一 种 方式 是 遍历 整个 XML 文档 , 使 用 类 似 XPath 查询 来 对 解析 的 元 素 进行 定位 。 以 下 是 一 个 遍 

















历 XML 文档 的 函数 ， 从 XML 中 读 取 并 生成 Blog 和 Post 对 象 。 





import ast 
doc= XML.parse( io.StringIO(text.decode('utf-8')) ) 
xml blog= doc.getroot () 
blog= Blog( xml blog.findtext ('title') ) 
for xml post in xml blog.findall('entries/entry'): 
tags= [t.text for 七 in xml post.findall( 'tags/tag' )] 
Post= Post ( 
date= datetime.datetime.strptimel( 
xml post.findtext ('date'), "%Y-%Sm-%d %H: SM:%S"), 
title=xml post.findtext ('title'), 
tags=tags, 
rst text= xml post.findtext('rst text') 





) 
blog.append( post ) 
render( blog ) 








以 上 代码 完成 了 对 一 个 <plog> 标 签 的 遍历 操作 。 它 查找 了 <tit1le> 标 签 并 获取 了 元 素 中 的 








文本 ， 用 于 创建 最 上 层 的 Blog 实例 。 然 后 它 会 查找 <entries> 元 素 内 的 <entry> 子 元 素 。 这 个 


\ 二 



































过 程 将 用 于 创建 每 个 Post 对 象 。Post 对 象 中 不 同 的 属性 会 被 分 别 转换 。 在 <tags> 元 素 中 的 每 个 



































<tag> 元 素 的 文本 都 会 被 转换 为 一 个 文本 值 列 表 。 日 期 会 从 它 的 文本 表示 中 解析 出 来 。 每 个 Post 对 
象 都 会 附加 在 全 局 的 Blog 对 象 上 。 这 种 从 XML 文本 到 Python 对 象 的 手动 映射 ,在 XML 文档 的 整个 
































解析 过 程 中 是 常见 的 。 
9.9 总 结 

















已 经 介绍 了 几 种 用 于 序列 化 Python 对 象 的 方式 。 我 们 可 以 将 类 定义 编码 为 多 种 格式 ， 包 括 























JSON、YAML、Pickle、XML 和 CSV， 每 种 格式 都 各 有 优 缺 点 。 














它们 对 应 的 类 库 模块 大 体 上 会 用 于 从 一 个 外 部 文件 中 加 载 对 象 或 将 对 象 转 储 到 一 个 文件 中 ， 这 些 



































模块 的 行为 并 不 是 完全 一 致 的 ， 但 它们 是 类 似 的 ， 因 此 可 以 使 用 一 些 通用 的 设计 模式 。 























使 用 CSV 和 XML 格式 往往 会 暴露 出 比较 复杂 的 设计 问题 。 在 Python 中 的 类 定义 可 能 会 包含 对 









































象 的 引用 ， 而 它 在 CSV 或 XML 格式 中 并 没有 一 种 很 好 的 表达 方式 。 


oy 











9.1 设计 要 素 和 折 中 方案 


Python 对 象 的 序列 化 和 持久 化 的 方式 有 很 多 。 之 前 介绍 的 并 不 是 全 部 。 本 节 中 介绍 的 格式 侧重 






































于 两 个 基本 的 用 例 。 
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@ 与 其 他 应 用 进行 数据 交换 : 我 们 需要 为 其 他 应 用 提供 或 接收 数据 。 对 于 这 类 场景 ,会 受 限 
制 于 其 他 应 用 的 接口 。 在 应 用 和 框架 中 ，JSON 和 XML 通常 是 用 来 进行 数据 交换 的 首选 
格式 。 在 一 些 情况 下 ， 也 会 考虑 使 用 CSV 来 交换 数据 。 

@ 应 用 中 数据 的 持久 化 : 对 于 这 类 场景 ， 通 常 使 用 pickle， 因 为 它 已 经 非常 成 熟 并 且 是 
Python 标准 库 中 的 一 部 分 。 然而，YAML 格式 的 可 读 性 是 它 最 主要 的 一 个 优势 ， 我们 可 以 
查看 、 编 辑 并 修改 。 

当 使 用 这 些 格 式 时 ,在 设计 上 需要 考虑 很 多 方面 ,首先 , 这 些 格 式 更 倾向 于 序列 化 单独 的 Python 
对 象 。 它 里 面 可 能 包含 了 一 个 对 象 的 集合 ， 但 它 仍 是 一 个 单独 的 对 象 。 例 如 在 使 用 JSON 和 XML 
时 ， 在 对 象 序列 化 之 后 会 附加 一 个 结束 分 隔 符 。 如 果 要 对 一 个 很 大 的 领域 中 的 每 个 对 象 做 持久 化 ， 
可 以 使 用 shelve 和 sqlite3。 详 细 内 容 可 参考 第 10 章 “ 用 Shelve 保存 和 获取 对 象 ” 和 第 11 章 





< F 
/ 




















] SQLite 保存 和 获取 对 象 ”。 








































































































































































































































































































JSON 是 一 种 被 广泛 使 用 的 标准 格式 。 在 表示 复杂 的 Python 类 时 ， 它 显得 不 够 方便 。 当 使 用 JSON 
时 ， 我 们 需要 考虑 到 如 何 使 对 象 与 SON 格式 兼容 。JSON 文档 的 可 读 性 很 剖 ，JSON 自身 的 限制 使 得 
它 在 互联 网 传输 的 过 程 中 是 安全 的 。 

YAML 并 不 像 JSON 这 样 常用 , 但 是 它 为 序列 化 与 持久 化 的 过 程 提 供 了 很 多 方便 。YAML 文档 
可 读 性 很 强 ， 对 于 可 编辑 的 配置 文件 来 说 ，YAML 是 理想 的 。 我 们 可 使 用 安全 加 载 选项 来 确保 YAML 
使 用 过 程 中 的 安全 性 。 

Pickle 对 于 简单 、 轻 量 级 对 象 的 持久 化 是 理想 选择 。 在 从 Python 到 Python 的 传输 中 ， 它 算是 
一 种 比较 紧凑 的 格式 。CSYV 是 一 种 被 广泛 使 用 的 标准 。 而 使 用 CSV 格式 来 表达 Python 对 象 并 不 是 


一 件 容易 的 事情 。 


对 象 转换 为 XML。 对 于 XML 用 
创建 Python 对 象 的 处 理 
由 于 每 个 CSV 的 行 在 很 大 程度 上 是 相互 独立 的 , 因此 我 们 可 以 对 CSV 中 的 很 多 对 象 构 成 的 集 


合 批量 地 进行 乡 次 性 加 载 入 内 存 的 大 集合 来 说 ， 使 用 CSV 进 
































当 在 CSV 格式 中 共享 数据 
且 必 须 提 供 在 Python 与 CSV 之 间 映 射 的 实 ] 

















XML 是 另 一 种 在 序列 化 : 





被 ) 








泛 使 用 














时 ， 通 常 在 应 
EN 。 
的 格式 。XML 非常 灵活 ， 



































列 ， 通 常 使 
过 程 通 常 很 复杂 。 


















































程序 ! 















































行 多 


用 码 和 解码 是 很 方便 的 。 

















分 别 根据 表格 文件 中 的 每 个 标签 进行 查找 。 在 每 个 表 ! 
对 象 之 间 是 对 应 的 。 在 每 行 中 ， 可 以 看 到 table-cell 元 素 中 包含 J 


档 中 的 一 个 文人 


























用 码 和 解码 。 从 这 点 来 看 ， 对 于 无 法 


9 些 情况 下， 我们 会 遇 到 混合 设计 的 问题 。 当 从 格式 比较 
套 在 XML 格式 中 的 CSV 的 行 和 列 的 解析 问题 。 例 如 ，oOpenoffice.zrog.0DS 文件 压缩 的 档案 。 归 
F 是 content .xml 文件 。 对 body/spreadsheet/table 元 素 使 月 





大 | 









































折 的 











BE 子 表格 ， 




















9.9.2 ”模式 演化 





在 对 象 持久 化 的 过 程 中 ， 必 须 ? 















































于 创建 对 象 





以 namedtuples 为 结尾 ， 并 





此 有 很 多 方式 可 以 将 Python 
| XSD 或 DTD 来 对 外 部 规格 进行 说 明 。 人 解析 XML 并 














读 取 数 据 时 ， 会 遇 到 详 








日 XPath 搜索 将 会 
， 会 发 现 table-row 元 素 (通常 ) 与 Python 





属性 的 值 。 


E 解 决 模式 演化 的 问题 。 对 象 中 包含 了 动态 的 状态 和 静态 的 类 定义 ， 
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可 以 容易 地 对 动态 的 状态 进行 持久 化 ， 而 类 定义 则 为 持久 化 数据 的 模型 。 然 而 ， 类 并 不 是 完全 静态 的 。 
需要 有 一 种 规定 ， 用 于 定义 当 类 发 生变 化 时 ， 如 何 加 载 上 一 版 本 所 保存 的 数据 。 
在 对 主 次 版 本 号 进行 区 分 时 ， 最 好 考虑 到 与 外 部 文件 的 兼容 性 。 主 版 本 意味 着 文件 不 再 兼容 ， 
必须 进行 转换 。 次 版 本 意味 着 文件 格式 是 兼容 的 并 且 在 升级 过 程 并 不 涉及 任何 数据 转换 。 

一 种 常见 的 做 法 是 ， 将 主 版 本 号 包含 在 文件 扩展 名 中 。 我 们 可 能 会 有 文件 名 以 .json2 
或 .json3 为 结尾 用 于 标识 所 使 用 的 数据 格式 。 要 同时 支持 持久 化 文件 的 多 个 版 本 是 很 困难 的 。 为 
了 版 本 升级 的 过 程 更 流畅 ， 应 用 应 该 能 够 对 之 前 的 文件 格式 进行 解码 。 通 常情 况 下 ， 最 好 使 用 最 新 
的 、 数 字 最 大 的 文件 格式 来 做 持久 化 ， 尽 管 其 他 格式 也 是 可 以 使 用 的 。 

在 接 下 来 的 几 章 中 ， 会 研究 多 对 象 的 序列 化 过 程 。 在 shelve 和 sqlite3 模块 中 ,提供 了 多 
种 方式 同时 序列 化 大 批 不 同 的 对 象 。 之 后 ， 会 使 用 这 些 技术 以 及 表述 性 状态 传递 (REST) 来 完成 
进程 间 对 象 的 传输 。 而 且 ， 还 会 继续 使 用 这 些 技术 处 理 配 置 文件 。 


9.9.3 ”展望 


在 第 10 章 “ 用 Shelve 保存 和 获取 对 象 ” 和 第 11 章 “ 用 SQLite 保存 和 获取 对 象 ” 中 ， 将 会 介 
绍 两 种 常用 的 方式 ， 用 于 包含 很 多 对 象 的 大 集合 对 象 的 持久 化 。 在 这 两 章 中 ， 分 别 介绍 了 不 同 的 用 
来 创建 Python 对 象 的 数据 库 的 方式 。 

在 第 12 章 “ 传 输 和 共享 对 象 ” 中 ， 将 使 用 这 些 序列 化 技术 使 得 对 象 可 以 在 另 一 个 进程 中 可 用 。 
并 将 主要 使 用 RESTful 的 Web 服务 完成 对 象 在 进程 间 的 传输 ， 因 为 它 简单 而 且 普 遍 。 

在 第 13 章 “ 配 置 文件 和 持久 化 ”中 ， 我 们 会 再 次 使 用 这 些 序列 化 技术 。 在 这 种 情形 下 ， 会 使 
用 JSON 或 YAML 格式 来 对 应 用 中 的 配置 文件 进行 编码 。 





































































































































































































































































































































































































































































































































































































在 许多 应 | 
Pickle、CSV 和 XML”! 
的 独立 对 象 。 
































的 技术 更 偏向 于 处 理 单 








使 ) 












































应 | 
(Retrieve )、 更 新 (Update 〉 和 删除 (Delete )。 
































划 














中 ， 我 们 需要 独立 地 持久 化 多 个 对 象 。 第 9 章 “ 
的 对 象 。 


程序 中 通常 在 4 种 情况 下 会 持久 化 对 象 ， 它 们 统称 














为 CRUD 操作 : 
通常 ， 它 们 中 的 任意 一 个 操作 都 有 可 















































第 10 章 
用 Shelve 保存 和 获取 对 象 


字 列 化 和 保存 一 一 JSON、 
有 时 候 ， 我 们 需要 持久 化 更 大 的 域 


创建 〈Create )、 
能 应 用 于 

















YAML、 








获取 
域 中 的 任 





上 














j 不 是 使 用 单一 的 负载 机 制 或 者 全 部 保存 到 一 个 文件 中 。 
更 细 粒 度 的 基于 对 象 的 存储 机 人 















































意 对 象 ， 这 就 需要 一 个 更 复杂 的 持久 化 机 制 ， 而 

除了 浪费 内 存 之 外 ， 单 一 的 负载 和 全 部 保存 到 文件 的 效率 通常 低 ] 
时 用 更 复杂 的 存储 机 制 要 求 我 们 必须 更 仔 旨 

架构 提供 了 全 



































地 思考 职责 分 配 。 不 同 的 关注 
局 的 设计 模式 。 这 些 高 层 设 计 模 式 的 一 个 例子 是 三 层 架 构 (Three-Tier Architecture) 。 






































ev 
o 














主 点 为 我 们 的 应 用 程序 







































































@ ”表示 层 (Presentation tier): 这 可 能 是 一 个 Web 浏览 器 或 者 一 个 移动 应 用 ， 有 时 候 同 时 包 
括 这 两 个 。 

@ 应 用 层 (Application tier): 这 层 通 常 部 署 在 应 用 程序 服务 器 上 。 应 用 层 应 该 被 细 分 为 应 用 
程序 层 (appllication layer) 和 数据 模型 层 (data model layer)。 应 用 程序 层 的 类 包含 了 应 用 
的 行为 。 数 据 模型 层 定 义 了 问题 域 的 对 象 模型 。 

@ 数据 层 (Data tier): 这 层 包括 一 个 访问 层 (access layer) 和 一 个 持久 化 层 (persistence layer)。 











访问 层 为 持久 化 对 象 提供 














了 一 致 的 访问 方式 。 持 久 化 层 会 将 对 象 序列 化 六 





F 将 它们 保存 。 

















这 个 模型 可 以 应 用 于 一 个 独立 的 GUI 应 ) 


程序 。 表 示 层 是 GUI; 











分 和 数据 模型 ， 访 问 层 是 持久 化 模块 。 
项 解析 器 和 print () - 
shelve 模块 定义 了 一 
被 序列 化 并 且 被 写 进 
于 dbm 模块 保 在 和 获取 对 象 。 



























































这 个 部 分 主要 关注 应 用 层 中 的 数据 模型 和 数据 层 中 的 访问 和 持久 化 。 
的 一 个 类 ， 或 者 是 一 个 更 复杂 的 网 络 接口 。 

















是 某 个 应 用 程序 
类 之 间 的 接口 。 我 们 会 在 第 12 章 “ 传 输 和 共享 对 象 ” 中 介 























Te 。 我 们 也 可 以 反 序列 化 然后 从 文件 


它 甚至 可 以 应 用 于 命令 行 应 用 程序 ，i 

















绍 基于 网 络 的 接 


应 用 层 是 








处 理 业 务 逻 辑 的 部 








这 时 候 表 示 层 就 只 是 选 


在 本 章 中 ， 我 们 只 





口 。 





类 似 于 映射 的 容器 ， 我 们 可 以 用 它 存储 对 象 。 每 个 被 存储 的 对 象 都 会 
获取 任意 对 象 。snelve 模块 会 基 








这 些 层 之 间 的 接口 可 以 











关注 简单 的 类 和 











10. 


第 9 章 “ 序 列 化 和 
针对 基于 压缩 文件 
件 。 这 是 使 / 
了 ， 替 换 对 象 也 很 


1 分 析 持 久 化 对 象 用 例 























数据 




















下 








读 写 一 个 已 序列 化 
的 简洁 表 
困难 。 比 起 ) 







































































只 想 更 新 我 们 域 ， 





有 的 对 


象 是 一 个 相对 低 效 的 处 理 














能 根本 做 不 到 。 





示 法 的 结果 ， 即 很 难 在 文件 ! 
更 聪明 、 更 复杂 的 算法 来 解 
化 和 存储 对 象 。 当 我 们 的 域 中 包含 大 量 的 持久 化 操作 和 可 变 对 象 时 , 会 对 使 ) 
四 是 一 些 需 要 额外 考虑 的 部 分 。 

不 希望 一 次 把 所 有 的 对 象 都 力 
载 到 内 存 


0 载 到 内 存 中 。 对 于 许多 大 数据 


果 存 一 一 JSON、YAML、Pickle、CSV 和 XML”! 
的 对 象 。 如 果 想 要 更 新 文人 





















































对 象 的 





























许 我 们 
却 让 我 1 
些 我 





to 














A 
间 晶 


不 会 一 次 更 新 所 有 的 对 象 ， 可 








地 将 它们 
门 很 难 把 它们 追加 到 文件 
门 可 能 也 想 要 

















个 小 子 集 或 者 单 
方法 。 
[能 会 逐渐 累加 对 象 。 有 二 




















x 




















追加 到 一 个 文件 ! 






































的 功能 。 
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ACID 属性 


我 们 的 设计 必须 考虑 到 ACID 属性 (ACID properties) 是 如 何 应 | 
程序 往往 会 用 一 系列 相关 的 操作 改变 状态 ， 


变数 据 库 状 态 的 操作 集合 可 





存 入 另外 一 个 账户 。 全 


ACID 
@ 



































行 写 操作 ， 也 没有 处 至 
中 方法 太 过 于 依赖 操作 系统 。 对 
RESTful 的 数据 服务 器 。 





























将 序列 
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化 、 持 入 化 、 





10.1 






































分 析 持久 化 对 象 用 例 














] 带 来 




















| 
MW 
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介绍 的 持久 化 机 制 主要 
的 任何 一 个 部 分 ， 必 须 蔡 
定位 一 个 对 象 ， 同 时 如 果 对 象 的 大 小 改变 
这 些 难点 ， 我 们 希望 可 以 简单 地 序列 
些 额外 的 难点 。 





换 整 个 文 























j， 一 次 把 所 有 的 对 象 都 加 











种 实例 。 为 了 更 新 一 个 对 象 而 加 载 关 


























于 j 




















可 以 参考 第 11 章 “) 












































| SQLite 保存 和 获取 对 象 ” 和 第 12 章 “ 传 输 和 























格式 ， 例 如 YAML 和 























CSV， 
。 而 一 些 其 他 有 终止 符 的 格式 , 例如 JSON 和 XML， 








更 新 所 











门 允 


它 


] 开行 更 新 和 写 入 操作 整合 成 单一 的 数据 
库 概念 是 很 常见 的 做 法 。shelve 模块 自身 不 是 一 个 完整 的 数据 库 解 决 方 案 。shelve 内 部 使 用 的 dbm 
多 操作 事务 。 可 以 利用 操作 系统 底层 的 文件 锁 完成 更 新 操 
行 写 操作 ， 最 好 能 使 用 一 个 适当 的 数据 库 或 者 一 个 














享 对 象 ”。 





于 shelve 数据 库 的 。 应 用 


这 些 操作 会 将 数据 库 从 一 个 常态 转变 为 下 一 个 常态 。 改 


以 被 称 为 事务 (transaction)。 
多 操作 事务 的 一 个 例子 是 更 新 两 个 对 象 从 而 让 总 和 保持 不 变 。 比 如 ， 从 一 个 





性 户 中 取 钱 ， 然 后 








局 的 余额 必须 保持 不 变 ， 这 样 数据 库 才 会 处 于 


























个 一 致 并 
















































































正确 的 状态 。 




































































属性 描述 了 我 们 期 户 的 数据 库 事务 的 行为 。 我 们 用 4 个 规则 定义 我 们 的 预期 。 
原子 性 (Atomicity): 事务 必须 是 原子 的 。 如 果 事 务 中 包括 多 个 操作 ， 那 么 所 有 的 操作 都 
必须 全 部 完成 或 者 全 部 取消 。 永 远 都 不 应 该 存在 部 分 完成 的 事务 。 
一 致 性 〈Consistency): 事务 必须 保证 一 致 。 它 会 将 数据 库 从 某 个 状态 改变 为 另外 一 个 状 
态 。 事 务 不 应 该 破坏 数据 库 或 者 导致 同时 在 线 的 不 同 用 户 看 到 不 一 致 的 视图 。 对 于 已 完成 
的 事务 ， 所 有 的 用 户 都 应 该 看 到 相同 的 结果 。 
隔离 性 〈Isolation ): 每 个 事务 都 应 该 正常 运行 ， 就 好 像 他 们 是 完全 隔离 的 。 不 存在 两 个 用 
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户 可 以 互相 干扰 对 方 更 新 的 3 
能 更 慢 )， 这 样 对 数据 库 的 
持久 性 (Durability): 对 数据 库 的 改变 必须 是 持久 的 , 他 们 
和 操作 内 存 中 的 Python 对 象 时 
图 从 多 个 并 发 
的 话 ， 就 可 能 








kk © 

















不 是 持久 的 。 如 果 试 











化 (versioning) 


象 


























， 很 明显 ， 























只 获得 D 却 











shelve 模块 没有 直接 支持 原子 性 ， 

















多 个 操作 的 习 


会 上 
/ 


务 并 



































shelve 模块 不 保证 所 有 类 型 的 改变 都 可 以 持久 化 。 如 果 





前 要 原 让 必 

























































































我 1 





发 用 户 。 我 们 必须 能 够 将 3 
更 新 就 可 以 得 到 一 致 的 结 





发 的 访问 转变 为 顺序 访问 (有 可 





























应 该 被 正确 








地 存储 在 文件 系统 ! 














o 








门 只 有 ACEI 而 没有 DD。 根据 定义 ， 
的 进程 中 使 用 shelve 模块 ， 但 是 没有 使 用 锁 (locking〉 和 版 本 
于 了 ACI 属性。 





























它 没 有 提供 处 到 
E， 那 么 必须 保 订 














内 存 中 的 对 象 














包含 多 个 操作 的 事务 的 方法 。 如 果 有 包含 
F 它 们 这 些 操作 全 部 正常 工作 或 者 
到 更 复杂 的 try :语句 。 当 操作 失败 时 ， 我 们 必须 恢复 数据 库 的 前 一 个 状态 。 











全 部 失败 ， 这 可 能 


























改变 了 对 象 的 状态 ， 持 入 化 在 shelf 上 的 版 本 不 会 自动 改变 。 如 果 和 希望 改变 已 


后 在 内 存 : 
上 的 对 象 ， 应 用 程序 必须 显 式 地 更 新 shelf。 我 们 可 以 通过 使 用 
对 象 追踪 所 有 的 变更 ， 但 是 使 用 这 个 功能 会 影响 己 








10.2 创建 shelf 


创建 shelf 的 第 1 个 部 分 





和 A 
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一 个 持久 化 的 shelf 结构 。 





















































件 系统 中 。 之 后 我 们 会 用 














L 和 已 
[有 Eo 


模块 级 别 的 函数 一 一 shelve .open () 来 完成 ， 这 个 函数 用 
2 个 部 分 是 正确 地 关闭 文人 
个 更 完整 的 例子 来 展示 这 种 方法 。 














实际 上 ，shelve 模块 



































底层 与 DBM 兼容 的 库 。 因 出 
现时 的 不 同 点 无 关 紧 











要 。 





shelve.open () 函数 需要 两 个 参数 : 文件 名 和 文件 访问 模式 。 通 常 ， 我 们 
当 找 不 到 指定 的 shelf 8 
xz "是 以 只 读 方式 打开 shelf。 


个 已 经 存在 的 shelf， 或 孝 
































@ 'n' 创 建 一 个 新 的 空 





shelf; 任何 之 前 





关闭 shelf 是 非常 必要 的 ， 
里 器 ， 但 是 我 们 可 以 








和 全 

















YH 


























大 | 





了 gbm 模块 完成 打开 文件 和 时 
£， 实 现 snelve 的 功能 有 


'w' 必须 指定 一 个 已 经 存在 的 可 读 写 shelf， 
的 版 本 都 
为 这 样 才能 确保 它 被 正确 














Context1Lib.clos 








ing 




















不 
品 











数 确 














() 函 保 











更 多 内 容 ， 参 见 第 5 章 周 


6 可 























在 一 些 情况 下 , 我 们 可 能 





方法 会 在 关闭 之 前 保存 改变 。 理 想 的 生命 周 





import shelve 











对 象 和 上 下 文 和 
想 显 式 地 将 shelf 同步 到 磁盘 , 但 是 不 关闭 文件 。 shelve. sync () 


29 








的 使 用 ”。 





























期 会 


类 





from contextlib import closing 


with closing( shelve.open('some file') 


process( shelf 


) 


) 


以 下 面 的 代码 这 样 。 


as shelf: 


将 一 个 可 更 改 对 象 存在 shelf 上 ， 然 


经 存在 shelf 


> 























回 写 模式 (writeback mode) 让 shelf 























于 创建 
F， 这 样 所 有 的 改变 才能 被 正确 地 保存 到 文 
射 键 值 的 工作 。dbm 模块 自身 封装 了 


























些 不 同方 法 可 以 选择 ， 对 于 不 同 的 qbm 实 





用 默认 的 "ce 模式 打开 一 











对 就 创建 一 个 新 的 。 其 他 的 模式 主要 用 于 一 些 特定 的 情况 。 




















则 程序 会 抛 出 异常 。 
会 被 覆盖 。 
也 写 入 到 磁盘 中 。 








shelf 本 身 不 是 上 下 文 
shelf 被 关闭 。 关 于 上 下 文 管理 器 的 
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打开 一 个 shelf， 然 后 将 它 提 供给 应 用 程序 中 那些 真正 完成 需求 的 函数 使 用 。 当 这 个 过 程 完成 后 ， 









































这 个 上 下 文 可 以 确保 shelf 被 关闭 。 如 果 process () 函数 抛 出 一 个 异常 ，shelf 仍然 会 被 正确 地 关闭 。 
10.3 设计 适 于 存储 的 对 象 


如 果 对 象 很 简单 ， 那 么 把 它们 存 入 shelf 很 简单 。 对 于 不 是 复杂 的 容器 或 者 集合 类 型 的 对 象 ， 我 





























们 只 需要 创建 一 个 键 值 对 映射 就 可 以 。 对 于 更 复杂 的 对 象 ， 通 常 是 指 包含 了 其 他 对 象 的 对 象 ， 关 于 
对 象 的 访问 粒度 和 对 象 间 引用 ， 我 人 

















我 们 会 先 看 看 简单 的 情 * 















































] 必 须 做 一 些 额 外 的 设计 。 








， 这 种 情况 下 , 需要 做 的 只 是 设计 一 个 可 以 用 来 访问 对 象 的 键 , 然后 ， 

















会 介绍 一 些 更 复杂 的 情况 ， 在 这 些 情况 


10.3.1 “为 我 们 的 对 象 设计 键 


shelve〈 和 dbm) 的 一 个 重要 功能 是 可 以 即时 访问 大 量 对 象 中 的 任意 一 个 。shelve 使 用 了 一 
个 类 似 于 字典 的 映射 。shelf 的 映射 保存 在 持久 化 存储 中 ， 这 样 一 来 ， 我 们 放 在 shelf 中 的 任意 对 象 都 























会 被 序列 化 并 保存 。 序 列 化 的 部 分 是 用 
我 们 必须 用 某 种 键 来 标识 已 经 存储 在 shelf 中 的 对 象 ， 这 种 键 会 映射 到 对 应 的 对 象 。 和 字典 






































































































































样 ， 会 对 键 做 快速 的 哈 希 处 到 
这 些 字 节 的 总 和 取 模 。 由 于 Python 的 字符 串 简单 地 被 编码 为 字 节 ， 因 此 这 就 意味 着 用 字符 串 作 为 
键 是 一 种 常用 的 方式 。 这 和 内 置 的 dsict 不 同 ， 任 何 可 变 对 象 都 可 以 作为 键 。 
于 键 用 于 定位 值 ， 因 上 














下 ， 必 须要 考虑 到 对 象 的 访问 粒度 和 对 象 间 的 引用 。 
































pickle 模块 完成 的 。 





























。 这 里 的 哈 希 计算 之 所 以 快 是 因为 键 只 能 是 一 个 字 节 串 ， 哈 希 值 是 对 












































SS 
























































单 的 情况 ， 但 是 并 不 通用 。 

































































并 不 是 唯一 的 ， 社 会 安全 局 可 以 


提供 合适 且 唯 一 的 键 。 一 些 情况 下 ， 问 题 域 中 会 包含 一 个 属性 ， 这 个 属性 就 是 明显 的 唯一 的 键 。 在 那 种 
情况 下 ， 可 以 简单 地 用 这 个 属性 创建 键 : shelf [object .key attripbute]= object。 这 是 最 简 




















键 必须 是 

































































唯一 的 。 这 就 为 设计 类 带 来 了 一 些 需要 考虑 的 因素 ， 因 为 必 















































在 其 他 情况 下 ,应 用 程序 问题 域 不 会 为 我 们 提供 一 个 合适 的 唯一 键 。 当 对 象 的 所 有 属性 都 是 有 
可 能 变化 的 或 者 有 可 能 不 唯一 时 ， 这 个 问题 会 经 常 出 现 。 例 如 ， 以 美国 公民 为 例 ， 因 为 社会 安全 号 
E 复 利用 这 些 号 码 。 另 外 ， 一 个 人 可 能 会 误 报 了 SSN， 这 样 应 用 程 







































































序 就 必须 修改 它 。 由 于 它 可 以 被 更 改 ， 因 此 这 是 它 不 能 作为 主键 的 第 2 个 原因 。 
程序 中 可 能 会 有 一 些 非 字 符 串 类 
datetime 对 象 、 一 个 数字 或 才 


























值 都 编码 为 字 节 或 者 字符 串 。 





























对 于 没有 明显 主键 的 情 























型 的 值 可 以 作为 主键 的 备 选 。 例 如 ， 我 们 可 能 会 有 一 个 











甚至 将 元 组 作为 唯一 标识 符 。 在 所 有 这 些 情 况 中 ， 可 能 希望 将 这 些 




































































多, 我们 可 以 尝试 用 一 些 值 的 组 合 创 建 唯 一 的 组 合 键 (composite key) 。 























这 并 不 总 是 一 个 非常 好 的 主意 ， 因 为 现在 键 不 是 原子 的 ， 对 于 键 中 任何 一 个 部 分 的 改变 都 会 带 来 数 





据 更 新 的 问题 。 






































最 简单 的 方法 通常 是 使 / 

















对 象 的 一 个 替代 品 。 这 意味 着 对 象 的 任何 











代理 键 〈surrogate key) 设计 模式 。 这 个 键 不 依赖 于 对 象 中 的 数据 ， 它 是 


















































属性 都 可 以 被 改变 ， 并 且 不 会 带 来 什么 副作用 或 者 限制 。Python 
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内 部 的 对 象 IJD 是 代 开 
字符 串 键 包含 了 对 象 所 








对 于 保存 索引 的 命名 


AI 





空间 、 用 于 管理 





E 键 的 一 种 示例 。 
属 的 类 和 当前 类 示例 的 只 
不 同 的 类 的 对 象 保存 在 一 个 单一 的 shelf 上 。 即 使 只 准备 在 shelf 上 




















个 shelf 键 的 字符 串 表 示 可 以 遵循 这 种 模式 : class :oid。 






































当 我 们 有 了 


Ct 











selflobje 


class 








name 


的 元 数据 和 

















10.3.2 


门 提供 了 一 个 狗 
义 为 某 种 键 的 生成 器 。 


为 对 象 生 成 代理 键 

















特 的 类 名 条 











0 唯 














以 后 的 扩展 都 是 非 


一 标识 符 。 我 


门 可 以 用 这 种 
呆 存 一 种 类 型 
常 有 帮助 的 。 











式 的 键 简单 地 将 
的 对 象 ， 这 种 格式 


























我 们 会 用 一 个 整数 计数 器 生成 唯一 的 代理 键 。 为 了 保证 


将 它 和 
























































我 们 的 其 他 数据 都 保存 在 shelf 上 上。 尽管 Python 有 






































































































































































































































个 适合 的 业务 主键 后 , 我 们 可 能 想 做 一 些 后 面 这 样 的 
+":"+object.key attribute]= obJject。 


的 键 作为 每 个 对 象 的 简 








能 够 正确 
































内 















































置 的 对 象 ID， 但 是 不 应 该 使 用 


| 中 


事情 持久 化 shelf 上 的 对 象 : 





























标识 符 。 对 于 代理 键 ， 需 要 定 





地 更 新 这 个 计数 器 ， 我 们 会 























































































































Python 内 置 的 标识 符 作 为 代理 键 。Python 内 置 的 ID 号码 没有 任何 类 型 的 保证 。 
于 我 们 将 要 在 shelf 上 添加 一 些 用 于 管理 的 对 象 , 因此 必须 给 这 些 对 象 带 有 特殊 前 级 的 唯一 键 。 
我 们 会 考虑 使 用 _ DB， 这 会 作为 一 个 仿制 类 保存 在 我 们 的 shelf 上 。 设计 这 些 用 于 管理 的 对 象 时 需要 
考虑 的 和 设计 应 用 程序 对 象 类 似 。 我 们 需要 选择 存储 的 粒度 ， 有 以 下 两 种 选择 。 
@ 粗 粒 度 〈Coarse-Grained): 可 以 创建 一 个 单一 的 dict 对 象 负责 生成 所 有 的 代理 键 。 一 个 
类 似 于 _DB :max 这 样 的 键 就 可 以 用 于 标识 这 个 对 象 。 在 dict 内 部 ， 可 以 将 类 名 映射 到 当 
前 使 用 的 最 大 标识 符 值 。 每 次 创建 一 个 新 对 象 ， 我 们 都 会 从 这 个 映射 中 取出 一 个 卫 赋值 
给 该 对 象 ， 然 后 也 会 替换 shelf 中 的 上 映射。 我们 会 在 下 一 节 中 展示 粗 粒 度 的 解决 方案 。 
@ 细 粒 度 〈Fine-Grained): 我 们 可 以 向 数据 库 中 添加 许多 项 目 ， 每 个 项 目 都 包括 了 不 同类 对 
象 的 最 大 键 值 。 每 个 这 种 额外 的 键 项 目 都 遵循 DB:max:class 的 格式 。 每 个 键 的 值 都 是 
一 个 整数 ， 代 表 了 当前 已 经 赋值 给 类 的 最 大 序列 标识 符 。 
这 里 重要 的 一 点 是 ， 我 们 分 离 了 键 的 设计 和 应 用 程序 中 类 的 设计 。 我 们 可 以 (并 且 应 该 ) 
让 应 用 程序 类 的 设计 尽量 简单 。 为 了 让 shelve 正常 工作 ， 一些 必要 的 开销 是 允许 的 。 
10.3.3 设计 一 个 带 有 简单 键 的 类 
将 shelve 的 键 保存 为 已 经 在 shelf 上 的 对 象 的 一 个 属性 是 很 有 帮助 的 。 把 键 保 存在 对 象 中 让 删 

















将 它 保存 到 shelf 上 。 











每 个 在 内 存 











获取 对 象 时 ， 有 


会 将 










































































是 已 知 的 。 这 利 


两 种 情况 。 我 们 可 能 想 要 获取 
各 键 映射 到 对 应 的 对 象 。 我 们 可 能 也 想 获取 一 个 相关 对 象 





换 对 象 更 加 容易 。 显 然 ， 当 创建 一 个 对 象 时 ， 我 们 会 从 创建 
且 对 象 被 保存 在 shelf 上 ， 就 需要 为 对 
的 对 象 都 会 包含 一 个 正确 的 键 。 

















个 键 已 


ES 





























个 没有 键 的 版 本 开始 ， 直 到 


























久 的 Python 对 象 设置 一 个 键 属性 ， 这 样 

















知 的 特定 对 象 ， 在 这 种 情况 下 ，shelf 
的 集合 , 这 些 对 象 的 键 我 们 


可 能 不 知道 ， 



































是 
节 会 介绍 搜索 算法 。 


其 他 的 一 些 属 性 值 


情况 下 ， 我 们 会 











某 利 

















搜索 或 才 


查询 找 出 对 象 的 键 。 下 个 小 
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为 了 能 够 在 对 象 中 保存 shelf 的 键 ， 我 们 会 为 每 个 对 象 添 加 一 个 _id 属性 。 它 会 维护 每 个 保存 
到 shelf 上 或 者 从 shelf 中 获取 的 对 象 的 键 。 这 样 的 设计 简化 了 从 shelf 上 蔡 换 或 者 删除 对 象 这 样 的 
维护 操作 。 我 们 有 下 面 几 种 方式 可 以 把 这 个 属性 添加 到 类 中 。 

@ No: 这 不 是 类 中 必需 的 属性 ， 这 只 是 为 了 持久 化 产生 的 一 个 额外 开销 。 

@ Yes: 这 是 很 重要 的 数据 ， 我 们 应 该 在 ”init () 中 正确 地 初始 化 它 。 
建议 不 要 在 ”init _() 方 法 中 定义 组 合 键 ,它们 不 是 类 的 基本 组 成 部 分 ， 而 只 是 持久 化 实现 
的 一 部 分 。 一 个 组 合 键 不 会 包含 任何 方法 函数 ， 例 如 ， 它 永远 不 会 作为 应 用 程序 层 中 业务 逻辑 层 或 
者 表示 层 的 一 部 分 。 下 面 是 Blog 的 高 层 定 义 。 
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class Blog: 





def init ( self, title, *posts ): 
self.title= title 
def as dict( self ) : 
return dict( 
title= self.title, 
underline= "="*]en(self.title), 


) 


我 们 只 是 提供 了 一 个 title 属性 和 一 点 其 他 逻辑 , 可 以 将 Blog.as_qict () 方 法 与 模板 一 起 
j 为 RST 标记 提供 字符 串 值 。 有 关 博 客 中 帖子 的 部 分 会 留 到 下 一 章节 中 介绍 。 
可 以 用 下 面 的 方法 创建 一 个 Blog 对 象 。 


>>> bl= Blog( title="Travel Blog" ) 


可 以 用 下 面 的 方式 将 这 个 简单 的 对 象 保存 在 shelf 上 。 


>>> import shelve 

>>> shelf= shelve.open ("blog") 
>>> bl. id= 'Blog:1" 

>>> shelfl[bl. id]= bl 


我 们 以 创建 一 个 新 的 shelf 开始 ， 文 件 名 是 "blog"。 我 们 往 Blog 的 实例 bl 中 插入 了 键 
Blog:1'， 然 后 用 赋 给 id 属性 的 键 将 Blog 对 象 保存 到 shelf 上 。 
可 以 用 下 面 的 方式 将 对 象 取 


>>> shelf['Blog:1'] 

< main .Blog object at 0x1007bccdq0> 
>>> shelf['Blog:1'] .title 

'Travel Blog'"' 
>>> shelf['Blog:1']. id 
'Blog:1" 
>>> list (shelf.keys()) 
EY BEOGSLY 
>>> shelf.close() 


调用 shelf['Blog:1'] 时 ， 它 会 从 shelf 上 取 回 原始 的 Blog 实例 。 正 如 我 们 从 键 列表 




































































使 


























Mp 

















































































































回 | 




















Ik 









































Se 








看 到 的 ， 只 是 在 shelf 上 保存 了 一 个 对 象 。 由 于 最 后 关闭 了 shelf， 因 此 对 象 会 被 持久 化 到 文件 系统 
中 。 我 们 可 以 退出 Python 命令 行 ， 然 后 重新 启动 ， 打 开 这 个 shelf， 用 定义 的 键 获取 对 象 ， 会 看 到 
对 象 仍然 保存 在 shelf 上 。 前 面 提 到 了 查询 的 第 2 个 用 处 : 在 不 知道 键 的 情况 下 定位 一 个 元 素 。 下 
面 是 根据 一 个 给 定 标 题 搜索 所 有 相关 的 博客 的 例子 。 


>>> shelf= shelve.open('blog') 

>>> results = ( shelf[k] for k in shelf.keys() if 
k.startswith('Blog:') and shelf[k] .title == "Travel Blog' ) 
>>> list (results) 

[<_ main .Blog object at 0x1007bcc50>] 

>>> r0= _[0] 

>>> r0.title 

'Travel Blog'"' 

>>> r0. id 


'Blog:1" 






















































































打开 shelf 访问 对 象 ， 用 results 生成 器 表达 式 遍 历 shelf 上 的 每 个 元 素 ， 查 询 出 所 有 以 
'Blog: ' 为 键 的 开始 并 且 对 象 的 title 属性 是 'Travel Blog' 的 元素。 

这 里 很 重要 的 一 点 是 键 'Blog:1' 是 保存 在 对 象 本 身 中 的 。_iqd 属性 确保 程序 中 的 任何 对 
象 都 有 一 个 正确 的 键 。 现 在 可 以 修改 对 象 ， 然 后 用 原始 的 键 来 替换 存在 shelf 上 的 对 象 。 


10.3.4 ”为 容器 和 集合 设计 类 
处 理 更 复杂 的 容器 或 者 集合 时 ， 类 的 设计 会 变 得 更 复杂 。 第 1 个 问题 是 容器 的 范围 ,我们 必 
shelf 上 对 象 的 粒度 。 
使 用 容器 时 ， 我 们 可 以 将 整个 容器 作为 一 个 单一 的 复杂 对 象 保存 到 shelf 上 。 在 某 种 程度 上 ， 这 种 
做 法 可 能 违背 了 在 shelf 上 保存 多 个 对 象 的 初衷 。 保 存 一 个 巨大 的 容器 为 我 们 带 来 了 粗 粒 度 的 存储 结构 。 
如 果 改 变 容 器 中 的 一 个 对 象 , 那么 整个 容器 都 必须 重新 序列 化 并 保存 。 如 果 可 以 高 效 地 将 全 部 对 象 都 保存 
在 一 个 单一 容器 中 ， 那 么 为 什么 还 要 使 用 shelve? 因此 ， 我 们 必须 找到 一 个 符合 程序 需求 的 平衡 点 。 
另外 一 个 选择 是 将 集合 分 解 为 独立 的 元 素 。 用 这 种 方法 的 话 ， 最 高 层 的 Blog 对 象 不 再 是 一 个 
合适 的 Python 容器 。 父 类 可 能 会 通过 键 的 集合 来 获取 每 个 子 类 ， 每 个 子 对 象 可 以 用 键 获取 父 对 象 ， 
这 种 键 的 使 用 方法 在 面向 对 象 设计 中 并 不 常用 。 通 常 , 对 象 只 是 简单 地 包含 了 指向 其 他 对 象 的 引用 。 
当 使 用 shelve (或 者 其 他 数据 库 ) 时 ， 我 们 必须 通过 键 使 用 间接 引用 。 
现在 每 个 子 类 都 有 两 个 键 : 它 自己 的 主键 和 一 个 指向 父 对 象 主键 的 外 键 。 这 就 带 来 了 第 2 个 问 
题 ， 如 何 用 字符 串 表 示 父 类 和 它们 的 子 类 的 键 ? 


10.3.5 ”用 外 键 引 用 对 象 


我 们 用 来 唯一 标识 一 个 对 象 的 键 是 主键 。 当 子 对 象 引 用 父 对 象 时 ， 需 要 添加 一 些 额外 的 设计 。 要 如 何 
格式 化 子 对 象 的 主键 ? 有 两 种 常用 的 设计 子 类 主键 的 方法 , 这 两 种 方法 都 基于 类 的 对 象 间 是 何 种 依赖 关系 。 
@ "child:cid": 当 子 类 可 以 独立 于 父 类 存在 时 ， 会 考虑 使 用 这 种 格式 。 例 如 ， 发 票 中 的 

















































































































须 确 






































I ll 




























































































































































































































































































































































































10.3 ”设计 适 于 存储 的 对 象 ”221 











一 个 条 目 代 表 一 个 产品 ， 即 使 没有 这 个 代表 产品 的 发 票 条 目 ， 这 个 产品 依然 可 以 存在 。 
@ "Parent:pid:Child:cid": 当 子 类 不 能 脱离 父 类 而 独立 存在 时 , 我 们 会 考虑 使 用 这 种 
格式 。 一 个 用 户 地 址 不 能 离开 用 户 而 单独 存在 。 当 子 类 完全 依赖 于 父 类 时 ， 子 类 的 键 可 以 
包含 父 类 的 键 来 反映 这 种 依赖 关系 。 
与 父 类 的 设计 一 样 ， 如 果 将 主键 和 所 有 与 子 类 有 关 的 外 键 都 保存 起 来 是 最 简单 的 方法 。 建 议 
不 要 在 _init _() 方 法 中 初始 化 它们 ， 因为 它们 只 是 持久 化 的 一 个 部 分 。 下面 是 Blog 中 的 Post 
的 通用 定义 。 


import datetime 




























































































































































































class Post: 
def _init ( self, date, titile, rst text, tags ): 
self.date= date 
self.title= title 
self.rst text= rst text 
self.tags= tags 
def as dict( self ) : 
return dict( 
date= str(self.date), 
title= self.title, 
underline= "-"*]len(self.title), 


rst text= self.rst text, 


tag text= " ".join(self.tags), 


) 
我 们 为 每 个 Post 都 提供 了 一 些 属 性 。Post .as_dict () 方 法 可 以 与 模板 一 起 为 RST 标记 提供 
字符 串 值 ， 我 们 避免 了 在 Post 中 定义 主键 和 任何 外 键 。 下 面 是 两 个 Post 实例 的 例子 。 


p2= Post ( date=datetime.datetime (2013,11,14,17,25), 
title="Hard Aground", 
































rst text="""Some embarrassing revelation. 
Including and 由"""， 
tags=("#RedRanger", "#Whitby42", "#ICW"), 
) 
p3= Post ( date=datetime.datetime (2013,11,18,15,30), 
title="Anchor Follies", 





rst text="""Some witty epigram. Including < & > characters."™"", 
tags=("#RedRanger", "#Whitby42", "#Mistakes"), 
) 
现在 我 们 可 以 通过 设置 属性 和 分 配 定义 关系 的 键 来 将 这 些 Post 和 它们 所 属 的 Blog 联系 起 来 。 
我 们 会 用 几 个 步 又 来 完成 。 
1. 打开 shelf 获取 一 个 父 类 的 Blog 对 象 ， 我 们 称 它 为 owner。 




































































>>> import shelve 
>>> shelf= shelve.open ("blog") 
>>> owner= shelf['Blog:1'] 
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我 们 用 了 主键 来 定位 owner 对 象 。 一 个 真实 的 应 用 程序 可 能 会 根据 标题 来 搜索 这 个 对 象 ， 
可 能 也 会 创建 索引 来 优化 搜索 的 过 程 。 我 们 会 在 下 面 介绍 索引 和 搜索 。 
现在 ， 我 们 可 以 将 owner 的 键 分 配给 每 个 Post 对 象 ， 然 后 保存 这 些 对 象 。 
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Pp2. parent= owner. id 
p2._ id= p2. parent + ':Post:2" 
shelf[p2. id]= P2 


p3._parent= owner. id 
p3._id= p3. parent + " :Post:3' 
shelf[p3. id]= P3 




















我 们 把 父 对 象 的 信息 保存 在 每 个 Post 中 。 我 们 用 父 对 象 的 信息 创建 主键 。 对 于 这 种 依赖 关系 的 





Ps 


键 ， _parent 
键 ， parent 在 键 中 就 















































list(shelf.keys()) 











属性 的 值 是 多 余 的 ， 我 们 可 以 把 它 从 键 中 删除 。 但是， 如果 我 们 为 Posts 设计 了 独立 的 
i 不 是 多 余 的 。 当 我 们 查看 这 些 刍 时， 我 们 可 以 看 到 Blog 和 所 有 的 Post 实例 。 
































[有 gs yy TBLog:l sy BLOG: tL:PoOStS2"]| 
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p2._ parent 


'Blog:1" 


>>> 





P2. id 


BIOG LPoOSt. 2 




















们 会 单独 ; 


























当 我 们 从 子 对 象 中 获取 任何 的 Post 对 象 时 ， 会 知道 它 对 应 的 父 Blog 对 象 。 











用 另外 一 种 方法 获取 这 些 键 一 一 从 父 对 象 Blog 开始 到 子 对 象 Post， 这 样 的 做 法 更 复杂 一 些 。 我 
解 这 种 方法 ， 因 为 通常 会 希望 用 索引 来 优化 从 父 对 象 到 子 对 象 的 路 径 。 


10.3.6 ”为 复杂 对 象 设计 CRUD 操作 


当 我 们 将 一 个 大 集合 分 解 为 许多 独立 的 细 
是 互相 独立 的 对 象 ， 所 以 每 个 类 都 需要 一 系列 


























粒度 对 象 时 ，shelf 上 会 有 许多 不 同类 型 的 对 象 。 因 为 它们 
F 独 的 CRUD 操作 。 在 一 些 情况 下 ， 对 象 是 完全 独立 的 ， 























一 个 作用 于 某 个 类 的 对 象 的 操作 不 会 影响 这 个 对 象 以 外 的 其 他 对 象 。 





子 对 象 ， 














但 是 ， 在 我 们 的 例子 中 ，Blog 和 Post 对 
并 且 这 些 子 对 象 不 能 独立 存在 。 当 存在 这 种 依赖 关系 时 ， 就 会 有 关系 更 复杂 的 操作 需要 设 























让 





掉 是 设计 时 的 一 些 考量 。 














象 之 间 有 依赖 关系 。Post 对 象 是 某 个 Blog 对 象 的 














基于 独立 (或 者 父 ) 对 象 的 CRUD 操 





年。 











4 ”我 们 可 以 创建 一 个 全 新 的 空 父 对 象 ， 并 且 分 配 一 个 新 的 主键 给 它 。 我 们 可 以 稍 后 再 将 
子 对 象 分 配给 这 个 父 对 象 。 类 似 于 shelLf['parent :'+object. id]= object 这 样 的 





代码 会 创建 父 对 象 。 


* ”我 们 可 以 在 不 影响 子 对 象 的 前 提 下 修改 或 者 获取 父 对 象 ， 在 赋值 语句 的 右边 使 用 








shelf['parent:'+some id] 性 
































A 取 父 对 象 。 一 旦 我 们 得 到 了 父 对 象 ， 我 们 可 以 用 
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shelf['parent:'+tobject. id]= object 保存 修改 。 
4 删除 一 个 父 对 象 有 两 种 方式 。 一 种 方式 是 级 联 删 除 所 有 和 当前 父 对 象 相关 的 子 对 象 。 
男 一 种 选择 是 可 以 通过 写 代码 来 禁止 删除 那些 仍然 包含 子 对 象 的 父 对 象 。 这 两 种 方式 
都 是 合理 的 ， 我 们 可 以 根据 问题 域 的 需求 做 出 正确 的 选择 。 
@ 基于 依赖 (或 者 孩子 ) 对 象 的 CRUD 操作 。 
4 ， 我们 可 以 创建 一 个 引用 了 已 经 存在 的 父 对 象 的 子 对 象 。 我 们 必须 处 理 设计 键 的 问题 ， 
决定 我 们 想 为 这 些 子 对 象 使 用 哪 种 键 。 
4 ”我 们 可 以 在 父 对 象 之 外 更 新 、 获 取 或 者 删除 子 对 象 。 这 个 过 程 也 包括 将 子 对 象 分 配给 
男 外 一 个 父 对 象 。 
于 替换 对 象 和 更 新 对 象 的 代码 是 相同 的 ，CRUD 操作 一 般 都 可 以 通过 简单 的 赋值 语句 来 处 
理 。 删 除 通过 del 语句 完成 , 删除 与 某 个 父 对 象 相关 的 子 对 象 可 能 需要 一 个 查询 操作 获取 这 些 子 对 
象 。 然 后 ， 剩 下 的 就 是 复杂 一 些 的 查询 操作 。 


10.4 搜索 、 扫 描 和 查询 


别 怕 ， 这 些 只 是 同义词 。 我 们 会 交换 地 使 用 这 些 词 。 

对 于 数据 库 搜索 的 设计 ， 我 们 有 两 种 选择 。 我 们 可 以 返回 一 系列 的 键 或 者 是 一 系列 的 对 象 。 
于 我 们 的 设计 强调 要 将 键 保存 在 每 个 对 象 中 ， 从 数据 库 获取 一 系列 的 对 象 能 够 满足 我 们 的 需求 ， 所 
以 我 们 会 主要 关注 这 种 设计 。 

搜索 天 生 就 是 低 效 的 操作 ， 我 们 会 倾向 于 将 更 多 的 注意 力 放 在 索引 上 。 在 后 面 的 章节 中 ， 我 们 
会 介绍 如 何 创建 更 有 用 的 索引 。 但 是 ， 暴 力 扫描 总 是 有 效 的 备用 方案 。 
当 一 个 子 类 包含 一 个 独立 的 键 时 , 我 们 可 以 基于 键 创建 一 个 简单 的 迭代 器， 这 样 就 能 很 容易 地 
扫描 shelf 上 某 些 chilg 类 的 所 有 实例 。 下 面 是 一 个 搜索 所 有 元 素 的 生成 器 表达 式 的 例子 。 


children = ( shelf[k] for k in shelf.keys() if key. 
startswithn ("Child:") ) 


这 段 代码 会 扫描 shelf 上 的 所 有 键 ， 然 后 选择 所 有 以 "child:" 作 为 键 的 开头 的 对 象 。 我 们 可 
以 基于 这 个 表达 式 来 创建 一 个 包含 更 多 条 件 的 更 复杂 的 生成 器 表达 式 。 

children py title = ( c for c in children if c.title == "some title") 

我 们 用 了 一 个 内 藤 的 生成 器 表达 式 向 一 开始 的 chilqren 查询 中 添加 了 条 件 ， 像 这 样 的 生成 
器 表达 式 在 Python 中 非常 高 效 。 这 个 表达 式 不 会 扫描 数据 库 两 次 ， 它 只 会 用 两 个 条 件 扫描 一 次 数 
据 库 。 内 层 生成 器 的 查询 结果 会 作为 外 层 生 成 器 的 查询 条 件 的 一 部 分 ， 从 而 创建 最 终 的 结果 。 
当 子 类 中 使 用 的 是 依赖 式 的 键 时 , 可 以 基于 更 复杂 的 匹配 条 件 创建 一 个 迭代 器 , 用 于 搜索 shelf 
上 茶 个 特定 父 对 象 的 子 对 象 。 下 面 是 搜索 一 个 给 定 父 对 象 的 所 有 子 对 象 生成 器 的 一 个 表达 式 。 


children of = ( shelf[k] for k in shelf.keys() if key. 
startswith (parent+":Child:") ) 
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这 种 依赖 式 的 键 结构 使 得 用 一 个 简单 循环 就 能 够 轻松 地 删除 父 对 象 和 它 的 所 有 子 对 象 。 


for obj in (shelf[k] for k in shelf.keys() if key.startswith (Parent) ) : 
del obj 


当 使 用 "Parent :pid:Child:ciqd" 这 种 分 层 的 键 时 ， 在 需要 区 分 父 对 象 和 它们 的 子 对 象 时 
必须 非常 小 心 。 由 于 存在 这 种 多 部 分 组 成 的 键 , 因此 我 们 会 有 许多 对 象 的 键 都 以 "Parent :pig" 为 开始 。 
这 些 键 中 的 其 中 一 个 指向 的 是 正确 的 父 对 象 ， 就 是 只 包含 "Parent :pig" 的 键 。 其 他 的 键 指向 的 是 以 
"Parent :pid:Child:cig" 为 键 结构 的 子 对 象 。 在 这 些 强力 搜索 过 程 中 ,， 有 3 种 条 件 我 们 会 经 常用 到 。 
@ key.startswith("Parent:pid"): 查询 父 对 象 科 所 有 的 子 对 象 ， 不 过 不 是 一 个 常见 
的 需求 。 
@ key.startswith("Parent:pid:Child:"): 只 查询 给 定 父 对 象 的 子 对 象 。 我 们 可 以 用 
一 个 正则 表达 式 来 匹配 键 ， 例 如 z"^ (Parent:\d+) : (Child:\d+) $"。 
@ key.startswith("Parent:pigd") 和 ":Child:": 只 查询 父 对 象 ,不 返回 任何 子 对 象 。 
我 们 可 以 用 一 个 正则 表达 式 来 匹配 键 ,例如 r"^Parent:\d+t$"。 
所 有 的 这 些 查 询 都 可 以 通过 创建 索引 来 优化 。 
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下 面 讲解 应 用 程序 中 可 能 的 shelve 用 法 , 会 介绍 应 用 程序 中 修改 和 保存 博客 文章 的 部 分 。 我 
们 将 这 个 应 用 分 成 两 层 : 应 用 层 和 数据 层 。 其 中 ， 又 将 应 用 层 分 成 了 两 层 。 

@ 应 用 处 理 (Application processing): 这 些 对 象 不 是 持久 的 。 这 些 类 会 包括 程序 中 所 有 

的 行为 。 这 些 类 会 响应 用 户 选 择 的 命令 、 菜 单项 、 按 钮 和 其 他 处 理 元 素 。 

@ 问题 域 数 据 模型 (Problem domain data model): 这 些 对 象 会 被 保存 到 shelf 上 ， 这 些 对 象 

包含 了 程序 的 所 有 状态 。 

前 面 介绍 的 博客 和 文章 的 例子 中 ， 博 客 和 它 的 文章 集合 没有 显 式 的 联系 。 它 们 是 互相 独立 的 ， 
所 以 我 们 可 以 在 shelf 上 分 别处 理 它们 。 我 们 不 想 通 过 把 Blog 变 成 一 个 集合 类 型 来 创建 一 个 独立 
的 巨大 集合 对 象 。 

在 数据 层 中 ， 依 据 数据 存储 的 复杂 度 ， 可 能 会 有 若干 特性 。 我 们 只 关注 其 中 的 两 个 。 

@ 访问 (Access): 这 些 组 件 为 问题 域 中 的 对 象 提 供 了 统一 的 访问 方法 。 我 们 会 定义 一 个 提 

供 了 访问 Blog 和 Post 实例 的 方法 的 Access 类 , 它 也 会 管理 用 于 定位 shelf 上 的 Blog 
和 Post 对 象 的 键 。 

@ 持久 化 (Persistence): 这 些 组 件 将 问题 域 对 象 序列 化 之 后 保存 到 持久 化 存储 模块 中 。 这 是 

shelve 模块 。 

我 们 会 将 Access 类 分 成 3 个 部 分 ， 下 面 是 处 理 打 开 和 关闭 文件 的 第 1 个 部 分 。 


import shelve 










































































































































































Ey 

































































































































































































































































































































































class Access: 
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def new( self, filename ) : 
self.database= shelve.open (filename,'n') 
self.max= { 'Post': 0, 'Blog': 0 } 
self.sync() 
def open( self, filename ) : 
self.database= shelve.open (filename,'w') 
self.max= self.database[' DB:max'] 
def close( self ): 
if self.database: 
self.database[' DB:max']= self.max 
self.database.close() 
self.database= None 
def Sync( self ) : 
self.database[' DB:max']= self.max 
self.database.sync() 
def quit( self ): 
self.close() 


























我 们 用 Access .new() 创建 一 个 新 的 空 shelf。 用 Access .open () 打开 一 个 已 经 存在 的 shelf。 
用 Access.close() 和 Access.sync() 将 当前 最 大 的 刍 保 存在 shelf 上 的 一 个 小 字典 中 。 

我 们 还 有 一 些 没有 实现 的 功能 ， 例 如 ， 实 现 用 于 复制 文件 的 Save As... 方 法。 我 们 也 还 没 
有 实现 能 够 恢复 到 前 一 个 版 本 的 数据 库 文件 的 不 保存 关闭 《quit-without-saving〉 选 项 。 这 些 额 外 的 
功能 会 使 用 os 模块 管理 文件 。 我 们 已 经 提供 了 close () 和 quit () 方 法 。 这 让 设计 一 个 GUI 应 ) 
程序 简单 了 一 些 。 下 面 是 用 来 更 新 shelf 上 的 Blog 和 Post 对 象 的 一 些 不 同方 法 。 


def add blog( self, blog ): 
self.max['Blog'] += 1 
key= "Blog: {id}".format (id=self.max['Blog']) 
blog. id= key 
self.database[blog. id]= blog 
return blog 
def get blog( self, id ): 
return self.database[id] 
def add post( self, blog, post ) : 
self.max['Post'] += 1 
try: 
key= "{blog}:Post:{id}".format (blog=blog. id,id=self. 
max['Post"]) 













































































































































































except AttributeError: 
raise OperationError( "Blog not added" ) 
post. id= key 
post. blog= blog. id 
self.database[post. id]= post 
return post 
def get post( self, id ): 
return self.database[id] 
def replace post( self, post ): 
self.database[post. id]= post 
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return post 
def delete post( self, post ): 
del self.database[post. id] 


我 们 提供 了 将 Blog 和 与 它 相 关 的 Post 实例 保存 到 shelf 上 所 需要 





添加 Blog 时 ，adq_blog () 方 法 首先 算出 一 个 部 



































和 在 字典 中 设置 一 个 元 素 的 操作 类 似 ， 
当 添 加 一 个 Post 时 ， 必 须 提供 父 









































Blog 对 象 保存 到 shelf 上 。 我 们 突出 显示 了 用 于 修改 shelf 的 代码 。 简 单 地 在 shelf 上 设置 
这 个 操作 会 把 对 象 保存 起 来 。 
对 象 Blog， 这 样 shelf 上 的 这 两 个 对 象 才能 正确 地 关联 起 来 。 在 
































的 最 基本 的 方法 。 当 我 们 
所 的 键 ， 然 后 用 这 个 键 更 新 Blog 对 象 ， 最 后 ， 它 将 
个 元 素 




































































这 种 情况 下， 我们 首先 获取 Blog 的 键 ， 然 后 为 Post 创建 一 个 新 键 ， 最 后 用 这 个 新 键 更 新 Post 对象。 














更 新 后 的 Post 对 象 可 以 被 保存 到 shelf 上 , adq_post () 
试图 添加 一 个 没有 父 对 象 Blog 的 Post 的 情形 属 了 


























误 ， 因 为 Blog._id 属性 不 存在 。 

我 们 提供 了 典型 的 
没有 定义 蔡 换 Blog 和 删除 
Posts 存在 时 ， 
器 使 用 的 搜索 方法 ， 它 们 


def 





























|Ik 


Blog 的 方法 。 















































可 以 / 


_iter ( self ) : 

for k in self.database: 
if kK[0] == "_": 
yield self.database[k] 

def blog iter( self ): 

for k in self.database: 

















continue 


if not k.startswith ("Blog:"): 
continue # Skip children 


Lf VsPOSEs™ Ln ks 
yield self.database[k] 


def post iter( self, blog ): 











中 突出 显示 的 行 是 用 于 将 对 象 保存 到 shelf 上 的 。 





























换 Post 和 删除 Post 的 方法 。 
我 们 实现 删除 
选择 禁止 删除 Blog 还 是 级 联 删 除 所 有 相关 的 Posts。 
来 查询 Blog 和 Post 实例 。 





异常 ， 在 这 种 情况 下 ， 我 们 会 得 到 属性 错 























些 可 能 需要 的 操作 ， 比 如 ， 我 们 还 
必须 要 决定 当 还 有 
还 有 一 些 作为 迭代 


还 有 一 
Blog 的 方法 时 ， 
最 后 ， 























continue 


key= "{blog}:Post:".format (blog=blog._ id) 


for k in self.database: 
if not k.startswith (key): 
yield self.database[k] 
def title iter( self, blog, title ): 


return 

我 们 定义 了 默认 的 迭代 器 一 一 iter 
目前 ， 我 们 只 定义 了 一 个 这 样 
blog_iter () 方 法 会 遍历 所 有 Blog 对 象 。 





























(p for p in self.post iter (blog) 


() ， 它 会 返回 所 有 以 "_ "作为 键 的 开头 的 内 部 对 象 。 
的 键 一 一 _DB :max， 但 是 这 样 的 设计 为 我 们 创建 其 他 的 键 预 留 了 空间 。 


continue 


if p.title == title ) 









































由 于 Blog 和 Post 对 象 都 是 以 "Blog:" 作 为 键 























的 开头 ， 因 此 我 们 必须 显 式 地 丢弃 Blog 的 所 有 子 














一 | 











post iter() 


所 有 与 给 定 标题 














岗 
回 




















Post 对 象 。 一 个 更 好 的 方法 通常 是 创建 一 个 定 


由 的 索引 对 象 ， 我 们 会 在 下 面 的 章节 中 介绍 和 索引 有 关 的 主题 。 
方法 遍历 某 个 Blog 的 所 有 Post 对 象 , title iter () 


方法 扫描 所 有 的 Post 对 象 






































匹配 的 Post 对象 ， 这 个 操作 会 扫描 shelf 上 的 所 有 键 ， 所 以 它 有 潜在 的 性 能 





问题 。 
































我 们 也 必须 定义 一 个 用 于 在 某 个 给 定 


个 简 旧 




















编写 演示 脚本 
我 们 会 用 演示 


示 脚 本 会 保存 一 些 Blog 和 Post 对 象 到 数 




















的 生成 器 函数 ， 它 会 重用 post_iter () 方 法 并 且 只 返 


邯 本 技术 展示 一 个 应 用 程 
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Blog 中 查找 包含 特定 标题 的 Post 对 象 的 迭代 器 。 这 是 

















口 





匹配 的 Post 对 象 。 





标题 




















可 使 用 这 个 Access 类 来 处 理 博客 中 的 对 象 。 
然后 会 基于 这 些 数 据 展示 一 系列 应 用 程序 ! 








序 会 如 
据 库 



































公 | 
外 


可 能 


















































j 例 ， 更 完整 的 单元 测试 会 确保 所 有 的 功能 都 存在 





| 
/ 


元 测试 








用 到 的 操作 。 这 些 演示 脚本 可 以 被 扩展 为 六 
并 且 正 常 工作 。 以 

from contextlib import closing 
) 


) 
) 



































with closing( Access () as acce 
"blogy' 
access.add blog( bl 
# bl. id is set. 


for post in p2, Pp3: 


access.new( 


access.add post( bl, post 


# post. id is set 
b = access.get blog( bl. id 
b ) 
for p in access.post iter( b 
P ) 


print( b. id, 


Print Ped 
access.quit() 


我 们 在 访问 层 上 创建 了 Access 


类 ， 








下 演示 脚本 向 我 们 展示 Access 是 如 何 了 


这 上 


[ 作 的 。 





SS : 


) 


) 


让 





它 就 可 以 被 包含 在 一 个 上 下 文 管理 器 中 。 这 样 做 的 目 
































的 是 为 了 硼 
我 们 用 
上 File | New 完成 。 然 后 我 
用 它 的 shelf 键 来 更 新 
I 容 然 后 单 击 了 New Blog。 
旦 我 们 添加 了 
来 为 它 的 每 个 孩子 Post 对象 创建 键 。 
了 一 些 内 容 ， 然 后 单 击 了 New Post。 
最 后 ， 还 有 一 些 查 询 会 使 用 
我 们 可 以 运行 Access.get bl 
某 个 Blog 对 象 的 所 有 子 Post 对 象 。 最 后 的 
E 确 地 关闭 shelf。 
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El 
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保 不 管 有 没有 异常 发 生 ， 都 会 J 
Access.new() 创建 了 一 个 新 的 名 为 'blog' 的 shelf。 在 GUI 程序 ! 
门 添加 了 一 
Blog 对 象 。 在 GUI 程序 ! 


Blog, 我 们 就 可 以 添加 两 个 


shelf 上 的 键 和 对 象 。 这 些 查询 会 向 我 们 展示 这 个 脚本 的 最 终 运行 结 
og () 获取 某 个 已 经 创建 的 j 








E 确 地 关闭 访问 层 。 














， 这 个 操作 可 通 
个 新 的 博客 bl 到 shelf 上 。Access. adqq_ blog () 方 
， 这 个 操作 有 可 能 是 某 些 人 在 页 面 上 写 了 一 












































Blog 对 象 中 的 键 
是 一 个 用 户 在 页 


下 


属于 这 个 Blog 的 Post。 父 1: 
同样 地 ,在 GUI 程序 中 ， 这 个 情况 











会 
面 









































果 。 
Blog 对 象 , 用 Access.post iter() 遍 


有 来 生成 唯一 键 的 最 大 值 六 











过 
































RAccess .duit () 确保 会 保存 月 




















高 效 的 规则 之 一 是 避免 搜索 。 我 们 前 








看 展 示 的 一 个 遍历 shelf 上 所 有 键 的 例子 是 非常 低 效 的 。 








更 






































强调 性 的 说 法 是 ， 搜 索 意 味 着 低 效 。 我 人 











门 会 在 这 个 部 分 中 着 重 探讨 这 点 。 
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[a 


穷 举 搜 索 可 能 是 处 理 时 最 糟糕 的 方法 ， 我 们 必须 总 是 基于 数据 的 
子 集 或 者 映射 创建 索引 以 提高 性 能 。 











为 了 避免 搜索 ,我 们 需要 基于 被 搜索 的 元 素 创建 索引 。 有 了 这 些 索引 之 后 查询 茶 个 元 素 或 者 某 














些 元 素 时 就 不 用 遍历 整个 shelf。shelf 的 索引 不 能 引用 Python 对 象 ， 因 为 这 会 改变 对 象 存 储 的 粒度 。 





shelf 索引 只 能 基于 键 。 这 使 得 不 





穷 举 搜索 要 快 很 多 。 


























同 对 象 间 的 跳 转 变 得 不 直接 ， 但 是 仍然 比 遍历 shelf 上 所 有 元 素 的 








索引 的 一 个 例子 是 可 以 用 一 个 列表 保存 与 shelf 上 的 Blog 相关 的 所 有 Post 的 键 ， 也 可 以 很 
轻易 地 通过 修改 add_blog () 、aqdq_post () 和 delete_post () 方法 来 更 新 相关 的 Blog 对 象 。 
下 面 这 些 代码 是 博客 更 新 方法 的 修订 版 本 。 



































class Access2( Access ) : 











def add blog( self, 
self.max['Blog'] += 1 
"Blog: {id}".format (id=self.max['Blog']) 


key= 


blog. 
._post list= [] 

self.database[blog. id]= blog 
return blog 


blog 


_id= key 


def add post( self, 
self.max['Post'] += 1 


try: 


max['Post"]) 


blog ) : 


blog, post ) : 

















key= "{blog}:Post:{id}".format (blog=blog. id,id=self. 





except AttributeError: 





raise OperationError( "Blog not 


post. id= key 


post. blog= blog. id 


self.database[post. id]= post 


blog. post list.append( post. id ) 
self.database[blog. id]= blog 
return post 


def delete post( 


self; post. ): 


del self.database[post. id] 

blog= self.database[blog. id] 
blog. post list.remove( post. id ) 
self.database[blog. id]= blog 


add_blog () 方法 确保 每 个 Blog 都 有 一 个 额外 的 _ 








性 维护 一 个 属于 当前 
如 果 添 加 了 Posts 本 身 ， 那 么 就 
Blog 和 Post 对 象 保持 独立 。 





























全 





Blog 的 所 


























有 Post 的 键 的 列表 。 沪 





added" ) 








post_1list 属性 。 其 他 的 方法 会 用 这 个 属 
FE 意 我 们 不 是 将 Posts 本 身 添加 到 列表 中 ， 




















i 是 将 整个 Blog 保存 在 











shelf 上 的 单一 对 象 中 。 通 过 只 添加 键 ， 让 




















adqd_post () 方 法 将 Post 添加 到 shelf 上 。 它 也 会 将 Post ._ id 添加 到 Blog 中 维护 的 键 列 
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表 中 。 这 意味 着 任何 Blog 对 象 都 会 有 一 个 用 于 提供 所 有 子 Post 对 象 键 的 post_1list 属性 。 
这 个 方法 更 新 了 shelf 两 次 。 第 1 次 只 是 简单 地 保存 了 Post 对 象 。 第 2 次 的 更 新 至 关 重 要 ， 
我 们 没有 尝试 简单 地 修改 shelf 上 的 Blog 对象 ， 更 倾向 于 确保 保存 到 shelf 上 的 对 象 都 是 最 新 的 。 
类 似 地 , delete_post () 方法 通过 将 不 再 使 用 的 Post 索引 从 所 属 Blog 对 象 的 post_1List 
中 移 除 来 保证 索引 是 最 新 的 。 和 adqd_post () 类 似 ， 这 个 方法 也 更 新 了 shelf 两 次 : del 语句 删除 
Post， 然 后 更 新 Blog 对 象 以 反映 索引 的 改变 。 











这 些 修改 彻底 改变 了 查询 Post 对 象 的 方式 ， 下 





def iter ( self ) : 
for k in self.database: 
if k[0] == " ": continue 


yield self.database[k] 
def blog iter( self ): 
for k in self.database: 


if not k.startswith ("Blog:"): 


EE SPOSt:Y 
yield self.database[k] 
def post iter( self, blog ) : 


in k: 


for k in blog. post list: 
yield self.database[k] 
def title iter( self, blog, title ): 






































外 是 搜索 方法 的 修订 版 本 。 











continue 


continue # Skip children 






































return ( p for p in self.post iter(blog) if p.title == title ) 

我 们 将 post_iter () 中 的 扫描 替换 成 了 一 个 高 效 得 多 的 操作 ， 这 个 循环 会 基于 Blog 的 
_post_1ist 属性 中 存储 的 键 快速 地 返回 Post 对 象 , 我 们 可 以 考虑 将 for 语句 替换 为 一 个 生成 器 
表达 式 。 

return (self.database[k] for k in blog. post list) 


















































































































































post_itez() 方 法 的 这 个 优化 方式 的 目的 是 避免 搜索 所 有 的 键 。 我 们 将 搜索 所 有 的 键 蔡 换 成 了 
简单 适当 地 和 迭代 一 些 相关 的 键 。 下 面 是 一 个 简单 的 性 能 测试 的 结果 ， 我 们 交替 地 更 新 Blog 和 Post 
并 且 将 Blog 转换 为 RST 标记 。 

Access2: 14.9 

Access: 19.3 

和 预期 的 一 样 ， 避 免 搜 索 从 而 减少 了 处 理 Blog 和 每 个 Posts 所 需要 的 时 间 。 这 个 改变 是 非 
常 重要 的 ， 处 理 时 间 中 几乎 有 25% 的 时 间 都 浪费 在 搜索 上 。 

















创建 顶层 索引 





















































我 们 在 每 个 Blog 中 增加 了 一 个 用 了 
个 用 于 定位 所 有 Blog 实例 的 顶层 索引 。 
者 删除 的 Blog， 我 们 必须 要 更 新 索引 的 结构 。 





























间接 访问 对 象 的 另 一 种 设计 。 


定位 所 有 相关 Posts 的 索引 。 
基本 的 设计 方法 和 前 面 看 到 的 大 体 一 致 。 对 每 一 个 被 添加 或 








我 们 也 可 以 在 shelf 上 添加 一 

















为 了 能 够 正确 地 近代， 还 必须 修改 迭代 器 。 下 面 是 
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class Access3( Access2 ) : 
def new( self, *args, **kw ) : 
Super() .new( *args, **kw ) 
self.database[' DB:Blog']= list() 


def add blog( self, blog ): 
self.max['Blog'] += 1 
key= "Blog:{id}".format (id=self.max['Blog']) 
blog. id= key 
blog. post list= [] 
self.database[blog. id]= blog 
self.database[' DB:Blog'] .append( blog. id ) 
return blog 


def blog iter( self ) : 


return ( self.database[k] for k in self.database[' DB:Blog'] ) 


在 创建 数据 库 时 ,添加 了 一 个 管理 对 象 以 及 值 为 “_DB:Blog” 的 索引 。 











































































































_DB:Blog” 对 象 的 值 。 此 处 没有 演示 删除 的 实现 ， 因 为 这 部 分 逻辑 很 直接 。 




















这 个 索引 列表 将 上 
每 个 Blog 对 象 的 键 值 。 当 添加 一 个 新 的 Blog 对 象 时 ， 也 会 使 用 修改 的 键 值 列表 来 相应 地 更 















































当 对 Blog 对 象 中 的 文章 进行 欠 代 时 ,使 用 了 索引 列表 来 蔡 代 直接 在 数据 居 

















搜索 。 以 下 是 一 些 性 能 测试 的 数据 : 


Access3: 4.0 
Access2: ‘15:1 
Access: 19.4 























新 


来 存储 





中 使 用 关键 字 进 行 


























从 以 上 结果 中 可 以 得 出 绪论 ， 大 部 分 时 间 浪 费 在 了 使 用 关键 字 直接 对 数据 库 















































10. 7 有 关 更 多 的 索引 维护 工作 


很 明显 ， 在 shelf 索引 维护 方面 可 能 会 需要 做 更 多 的 工作 。 当 使 用 
































































































































索引 简单 的 列 出 了 博客 记录 的 所 有 键 值 。 另 外 一 个 索引 则 基于 博客 标题 提供 相 尺 



































简单 的 数据 模型 
的 为 一 篇 文章 的 标签 ， 日 期 和 标题 添加 索引 。 这 里 为 博客 的 另外 一 个 访问 层 定义 了 两 个 索引 。 了 




















进行 搜索 的 过 程 ! 





在 程序 的 性 能 优化 过 程 中 ， 首 先 应 该 要 考虑 到 的 就 是 尽量 避免 使 用 关键 字 对 数据 库 进 行 直接 搜索 。 

















4 时 ， 可 以 简单 
其 中 一 个 











应 键 




















是 唯一 的 。 我 们 会 从 3 个 方面 来 演示 这 个 访问 层 的 操作 。 以 下 是 CRUD 人 处理 过 程 中 的 Create 部 分 。 











class Access4( Access2 ) : 
def new( self, *args, **kw ) : 
super() .new( *args, **kw ) 
self.database['_DB:Blog']= list() 
self.database['_DB:Blog_Title']= defaultdict (list) 


def adqdq blog( self, blog ) : 
self.max['Blog'] += 1 
key= "Blog: (id)".format (id=self.max['Blog']) 


值 。 这 里 假设 标题 不 


我 们 添加 了 两 个 索引 : 
defaultqdict。 如 果 每 个 标题 都 是 
每 个 标题 都 会 有 一 个 


当 添 加 Blog 实 





存 到 shelf 上 的 方式 更 新 。 标 题 索引 需要 从 shelf 上 获取 现存 的 defaultdict， 
题 匹 配 的 键 列 表 追 加 到 它 的 尾部 , 最 后 将 defaultqdict 保存 在 shelf 上 。 下 
中 U( 更 新 ) 的 部 分 。 


def update blogl( 





























blog._id= key 


blog._post_list= 
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[] 


self.database[bloq._id]= blog 
self.darabase['_DB:Blog'] .append( blog._id ) 
blog title= self.database['_DB:Blog_Title'] 
blog_ title[blog.title] .append( blog._id ) 
self.database['_DB:Blog_Title']= blog title 


return blog 











个 简单 的 

















Blog 键 的 列表 。 



































Ti 























列 时 ， 也 需要 更 新 这 两 个 索引 。] 



































self, 





那么 所 有 的 列表 都 是 单 例 的 。 如 果 











Blog 键 列表 和 另 一 个 保存 了 与 某 个 给 定 标题 相关 的 键 的 
































blog ): 


"""Replace this Blog; update index."™"" 
self.database[blog. id]= blog 

blog title= self.database[' DB:Blog Title'] 
# Remove key from index in old spot. 


empties= 


[] 


for k in blog title: 
if blog. id in blog titlel[k]: 
blog title[k] .remove( blog. id ) 


if len(blog title[k]) 


== 0: 


# Cleanup zero-length lists from defaultdict. 


for 





k in empties: 


del blog title[k] 

# Put key into index in new spot. 

blog title[blog.titlel] .append( blog. id ) 
self.database[' DB:Blog Title']= blog title 





empties.append( k ) 



































































































































标题 不 唯一 ， 那 么 








Blog 键 的 简单 列表 通过 追加 一 个 新 键 然 后 保 
然后 将 与 Blog 标 
而 的 代码 展示 了 CRUD 


























当 我 们 更 新 Blog 对 象 时 ， 我 们 可 能 会 更 改 Blog 属性 的 标题 。 如 果实 体 中 包含 越 来 越 多 的 属 
性 和 索引 ， 我 们 可 能 希望 可 以 比较 修改 后 的 值 和 shelf 上 的 值 ， 这 样 就 能 知道 哪些 属性 被 更 改 了 。 
对 于 这 个 只 有 一 个 属性 的 简单 实体 ， 不 需要 任何 比较 就 可 以 知道 哪个 属性 被 更 改 了 。 

这 个 操作 的 第 1 个 部 分 是 将 Blog 的 键 从 索引 中 移 除 。 由 于 还 没有 得 到 Blog .title 属性 之 
前 的 值 ， 因 此 我 们 不 能 简单 地 基于 旧 的 值 移 除 键 。 取而代之 的 是 ， 我 们 必须 搜索 所 有 Blog 键 的 索 


























引 ， 





并 且 将 与 标题 相关 的 键 








的 标题 。 


标题 唯一 的 ] 





| 除 。 




















Blog 会 让 标题 的 键 列表 为 空 。 我 们 也 应 该 清理 无 用 ] 
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且 将 与 旧 标 题 相 关 的 键 从 索引 
和 一 开始 创建 Blog 时 所 用 的 相同 。 


def blog iter( self ) : 
( self.databasel 











return 


def blog title iter( 
blog title= self.databa 


return ( self.databasel 





blog_iter () 方法 函数 通过 从 shelf 上 获取 索引 对 象 来 遍历 所 有 的 
Blog 对 象 。 当 有 许多 标题 不 同 的 











方法 函数 用 索引 获取 某 个 给 定 标题 相 
法 可 以 快速 地 根据 标题 定位 到 一 个 B 








self, title 














| 中 移 除 ， 就 可 以 用 天 
下 面 是 一 些 碍 询 处 到 








的 例 





k] 


rs 
se[' DB:Blog Title'] 
K] 





关 的 1 
log 对 象 。 


10.8 用 writeback 代替 更 新 索引 


我 们 可 以 用 writeback=True 
































负担 的 方法 ， 这 里 展示 的 方式 会 更 间 
这 对 运行 时 性 能 只 有 轻微 的 影 
Blog 对 象 。 如果 要 添加 多 个 Post 























新 
通过 避免 | 























向。 


元 长 的 搜索 在 shelf 的 所 有 键 





模式 打 3 








s， 这 些 额 外 的 对 ] 
































的 怕 
存 > 


模式 演变 


AI 


当 使 用 shelve 时 ， 我 们 必须 习 


FE 能 ， 这 档 
天 





























了 类 定义 ,我 们 如 何 从 shelf 上 获取 对 象 呢 ?对 于 
改变 方法 函数 和 特性 不 会 改变 已 经 保存 的 对 象 状态 。 我 们 
网 改 后 的 类 定义 仍然 是 兼容 的 。 一 个 新 的 软 从 





为 已 经 保存 到 shelf 上 的 数据 与 


次 要 版 本 号 ， 用 户 对 这 种 版 本 应 该 有 足够 的 信心 ， 相 信 它 是 可 以 正常 
改变 属性 会 改变 已 经 保存 的 对 象 状态 ， 














据 与 新 的 类 定义 不 兼 
一 个 新 的 子 类 3 

我 们 可 以 灵活 地 支持 多 个 版 本 ， 
建 对 象 的 实例 。 一 个 灵活 的 应 用 程 
程序 的 所 有 部 分 都 可 以 一 致 地 协作 。 





容 。 这 利 





























一 来 也 能 平衡 writeback 
为 这 种 缓存 在 运行 时 有 可 能 无 限 种 


且 提 供 一 个 更 新 过 的 工厂 函数 来 创 
j 一 次 性 转换 。 为 灵活 性 考虑 ， 必 须 基 了 
序 会 避免 直接 创建 对 象 。 通 过 使 用 工 三 函数 ， 我 们 可 以 保证 应 用 
j 下面 这 样 的 方式 支持 灵活 


标题 


和 























巴 键 添加 到 索引 中 。 最 后 的 两 行 代码 








ra 


for k in self.database[' DB:Blog'] 


for k in blog titlel[title] 


剂 shelf 更 新 这 个 特定 对 象 的 持久 
例如，aqdqd_post () 操作 会 稍微 变 慢 一 些 ， 因 为 它 也 需要 更 
Blog 的 更 新 就 会 变 成 一 笔 不 小 的 ] 
查询 某 个 给 定 Blog 的 Post 对 象 ， 我 们 可 以 


) 


) 


Blog 对 象 。blog title iter() 
Blog 对 象 时 ， 这 个 方 








后 shelf， 这 种 模式 通过 保存 每 个 对 象 的 缓存 版 本 追踪 所 
有 可 变 对 象 的 更 改 。 相 比 于 跟踪 所 有 访问 过 的 对 象 来 检测 和 保存 更 
一 个 可 变 对 象 然后 强 4 





改 这 种 会 给 shelve 模块 带 来 沉重 


化 版 本 。 




















开销 。 但是， 
成 ] 





提高 








Blog 























所 带 来 的 玫 
| 增长 。 





F 销 。 这 上 








Hp 














有 展示 的 设计 会 避免 创建 writeback 组 





EE 视 模 式 演变 的 问题 。 对 象 包含 动态 的 状态 和 静态 的 类 定义 ， 可 
以 很 容易 地 持久 化 动态 的 状态 。 类 定义 是 持久 化 数据 的 模式 。 但 是 ， 





Nn 
I 





不 是 完全 静态 的 。 如 果 修 改 



































Sh 
FF 这 个 问题 ， 一 个 好 的 设计 通常 会 包含 以 下 几 项 技术 。 
可 以 将 这 些 改变 归 类 为 次 要 改变 ， 攻 
F 版 本 可 以 包含 一 个 新 的 

















作 的 。 








我 们 可 以 称 这 些 为 主要 改变 ， 因 为 已 经 保存 到 shelf 上 的 数 














类 型 的 改变 不 应 该 通过 修改 类 定义 来 完成 。 这 种 类 型 的 改变 应 ; 





玄 通 过 定义 


























或 者 可 以 J 











能 











我 们 可 


会 上 
/ 








建 这 个 类 不 同 版 本 的 实例 。 




















厂 函 数 创 























的 模式 改变 。 


def make blodg ( 


*args, **kw ) : 


version= kw.pop(' version',1) 
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if version == 1: return Blog( *args, **kw ) 
elif version == 2: return Blog2( *args, **kw ) 
else: raise Exception( "Unknown Version {0}".format (version) ) 





这 种 工厂 函数 需要 一 个 _ version 关键 字 参 数 来 明确 指定 要 使 用 哪个 Blog 类 的 定义 , 这 让 我 


们 可 以 在 不 破坏 现 有 程序 的 前 提 下 ， 重 用 一 个 模式 在 不 同 的 类 上 。 
正确 版 本 的 对 象 。 我 们 也 可 以 提供 一 个 下 面 这 样 的 流畅 接 


























class Blog: 
@staticmethod 


def version( self, version ): 



































self.version= version 
@staticmethod 
def blogl( 


self, *args, **kw ): 

















访问 层 可 以 基于 这 种 函数 实例 化 





if self.version == 1: return Blogl( *args, **kw ) 
lif self.version == 2: return Blog2( *args, **kw ) 
lse: raise Exception( "Unknown Version {0}".format (self.version) ) 








我 们 可 以 像 下 面 这 样 使 用 这 个 工厂 。 


blog= Blog.version(2) .blog( title=this, other attribute=that ) 


shelf 应 该 包含 模式 版 本 的 信息 ， 可 能 是 保存 为 一 个 特殊 的 _version_ 键 。 这 为 访问 层 决 定 
应 该 使 用 哪 一 个 版 本 的 类 提供 了 信息 。 应 用 程序 在 打开 shelf 之 后 应 该 首先 获取 这 个 对 象 ， 当 模式 
版 本 错误 时 应 该 立刻 终止 程序 。 

















这 种 级 别 灵活 性 





























取 shelf 上 的 所 有 对 象 ， 转 换 成 新 的 类 ， 然 后 用 新 的 格式 将 它 


音 》 这 可 是 一 个 打 ] 












































和 
发 布 应 用 程序 时 需要 i 





10.9 总 结 


我 们 介绍 了 shelve 模块 的 基本 用 法 , 包括 创建 shelf 3 
也 介绍 了 访问 层 需要 





RTVe 必 拓 国 估 直人 人 和 休 休 竹下 同时 天 二 








负担 。 过 于 








的 粒度 会 








保存 不 相关 的 元 素 。 








运行 的 一 个 脚本 。 




















于 的 文件 或 者 保存 的 文件 的 一 部 分 2 























/ 











在 shelf 上 执行 低层 的 CRUD 操作 。 这 样 
的 应 用 程序 本 身 服务 的 类 和 其 他 用 于 持久 化 的 类 。 


10.9.1 设计 要 素 和 折 中 方案 








改 的 主要 


























的 另外 一 种 实现 方式 是 一 次 新 转换 , 应 用 程序 的 这 个 功能 会 用 原始 的 类 定义 获 
它们 保存 回 shelf 上 。 对 GUI 应 用 程序 而 
六 网络 服务 器 而 言 ， 这 可 能 是 管理 员 在 



































存放 在 shelf 上 的 对 象 设计 键 。 我 们 


目的 是 我 们 需要 分 离 为 我 们 














浪费 时 间 将 它们 从 碎片 组 装 起 来 。 


这 








为 确定 合适 的 元 素 粒度 的 设计 增加 了 








过 于 粗 的 粒度 








会 浪费 我 们 的 时 间 去 获取 和 


第 10 章 用 Shelve 保存 和 获取 对 象 


























此 必须 为 对 象 设计 合适 的 键 ， 也 必须 管理 不 同 对 象 的 键 。 这 意味 着 使 



























































234 
于 shelf 需要 键 ， 因 
用 额外 的 属性 
用 来 访问 
处 理 基于 3 
基本 特殊 方法 ”。 
































这 种 方式 让 其 他 所 有 





shelve 数据 库 上 元 素 的 键 就 像 weakref， 它 是 一 个 间接 引 月 














呆 存 键 以 及 可 能 需要 为 shelf 上 的 元 素 创建 额外 的 键 集 合作 为 索引 。 














用 追踪 和 访问 元 素 。 关 于 weakref 的 更 多 信息 ， 参 见 第 2 














属性 仍然 可 以 被 改变 。 昌 
的 方式 表示 Python 对 象 。 这 











上 的 类 设计 的 复杂 度 。 任 何 Python 对 象 都 可 以 被 保存 在 shelf 上 。 


10.9.2 



























































应 用 软件 层 


于 使 用 shelve 时 程序 会 变 得 相对 复杂 ， 因 此 我 们 的 软件 必须 更 合理 地 分 层 。 通 常 ， 我 们 将 





表示 层 (Presentation layer): 顶层 用 户 界面 ， 
应 用 层 (Application layer): 让 应 用 程序 得 





问题 域 的 对 象 ， 这 





























可 能 是 一 个 Web 引 ) 
以 了 











与 逻辑 数据 模型 不 同 。 














的 博客 例子 介绍 了 应 该 如 何 定义 这 些 对 象 。 




















于 访问 snelve 数 




















软件 架构 分 为 下 面 几 个 层次 。 

@ 
@ 

以 被 称 为 处 理 模型 ， 
@ 

业务 领域 或 才 
4 

cutting concerns )， 例 如 日 志 、 
@ 

绍 了 如 何 设计 
@ 
































必须 掌握 一 些 设计 模式 。 我 们 不 能 简单 地 设计 狐 
构 的 。 最 后 ， 也 是 最 重要 的 ， 穷 举 搜索 是 一 个 可 怕 的 东 瑟 











更 大 的 结 





10.9.3 ”展望 


下 一 章 和 本 章 类 似 ， 我 们 会 介绍 如 何 用 











基础 架构 《Infrastruacture): 它 通 常 还 包括 一 些 其 他 

















月 。 这 意味 着 需要 额外 
章 “ 与 Python 无 颖 集成 一 一 





设计 键 的 一 种 方式 是 选择 不 会 被 改变 并 且 适 合作 为 主键 的 一 个 属性 或 者 一 些 属性 的 组 合 。 另 外 一 
种 方式 是 生成 不 可 以 改变 的 代理 键 ， 
pickle 表示 shelf 上 的 元 素 ， 所 以 我 们 有 一 种 高 性 能 


昌 于 shelve 依赖 于 





降低 了 保存 在 shelf 


























或 者 是 
E 常 工作 的 内 部 服务 或 者 控制 器 。 这 层 也 可 





























安装 和 网 络 访问 。 
数据 访问 层 (Data access layer): 这 层 包 含 了 月 
居 库 的 对 象 。 





持久 化 层 (Persistence layer): 这 是 文件 存储 系统 中 的 物理 
当 我 们 进入 第 11 章 “ 














立 的 类 ， 相 反 地 ， 



































来 访问 数据 对 象 的 协议 或 























模型。 我 们 通过 


数据 模型 。shelve 模块 实现 了 持久 
] SQLite 保存 和 获取 对 象 ” 时 ， 会 更 清楚 如 果 想 要 掌握 面向 对 象 编程 


我 们 需要 关注 类 是 如 何 被 组 织 为 























6， 我 们 必须 避免 使 


个 桌面 GUI 程序 。 





业务 逻辑 层 或 者 问题 域 模型 层 (Business layer or problem domain model layer): 定义 了 
屋 有 时 候 被 称 为 逻辑 数 所 





Blog 和 Post 


慨 和 一 些 其 他 的 横 切 关注 点 (cross- 











方法 。 我 们 介 















































J 


3。 




















SQLite 而 不 是 shelve 来 持久 化 我 们 的 对 象 。 复 杂 的 地 


方 是 SQL 数据 库 没 有 直接 支持 保存 复杂 Python 对 象 , 这 就 带 来 了 阻抗 失 配 问题 impedance mismatch 
problem)。 我 们 会 介绍 两 种 用 诸如 SQLite 的 关系 型 数据 库 解 坟 





第 12 章 “ 传 输 和 示 











k 享 对 象 ” 会 将 注意 力 从 简 和 




















们 在 本 章 所 介绍 的 持久 化 技术 ， 同 时 会 加 入 网 络 协议 。 





这 个 问题 的 方法 。 








的 持久 化 转 到 传输 和 共享 对 象 上 。 





这 会 基于 我 





在 许多 应 用 中 ， 
CSV 和 XML” 
独立 的 对 象 来 做 持久 化 。 比 如 将 博客 记录 、 博 文 、 作 者 以 及 广告 保存 在 

在 第 10 章 “ 用 Shelve 保存 逢 
数据 存储 来 保存 。 这 使 
获取 、 修 改 或 删 








被 创建 、 


第 11 


EE 
宣 


用 SQLite 保存 和 获取 对 象 


三 Bg = 
需要 完 
下 卓 


成 对 象 的 存储 。 在 第 9 章 “ 




















所 介绍 的 技术 了 


针对 











CC 六 人 








pA 


[获取 对 象 ”! 








的 对 象 。 








， 介 绍 了 将 不 


有 时 ， 




















除 ， 而 无 需 加 载 3 














在 本 音 ! 














数据 库 ， 








保证 3 





这 将 是 三 
在 这 个 设计 中 ，SQLite 数据 层 是 一 个 比 shelve 更 复杂 
发 的 更 新 操作 。SQLite 提供 了 一 个 基于 SQL 语言 的 访 





层 架构 设计 中 的 另 一 个 





























日. 甘 
十 有 其 


























以 位 





11. 1 


的 一 个 
从 可 扩展 性 来 看 ， 
六 相对 安全 
作为 独立 的 服务 进程 。 
来 说 ，Python 就 是 宿主 。 








网 子 。 








我们 可 以 为 一 个 大 的 领域 
转 储 整 个 文件 。 
， 我 们 会 介绍 从 Python 对 象 到 关系 数据 库 的 映射 ， 
网 子 。 





还 有 RESTful 的 数据 服务 器 ， 使 | 

















来 完成 持久 化 。 使 用 数据 库 而 非 一 个 简单 的 文件 来 处 理 














问 层 ， 


同 的 Python 对 象 
的 对 象 应 用 CRUD 操作 。 任何 











天 





的 数据 库 。 在 SQLite : 
可 以 通过 将 SQL 表 存 储 到 文件 

































































可 以 使 























的 主 机 环境 中 ， 与 Web 应 | 












































j 的 服务 器 分 3 
SQLite 不 是 独立 的 数据 库 服 务 ， 它 必须 作为 宿 3 


SQL 数据 库 、 持 久 化 和 对 象 





~ 











使 用 











SQLite 时 ， 会 使 








程 火热 








时 期 





模型 与 对 象 数据 
概念 模型 : 这些 实体 关系 是 基于 SQL 模型 创建 的 。 
Python 对 象 并 且 与 应 月 
逻辑 模型 : 它们 就 是 SQL 数据 
这 些 实体 。 这 个 模型 之 所 以 会 存在 ， 


一 个 关系 数据 库 和 








3 














所 遗留 的 一 种 语言 。SQL 语言 侧重 于 面 























日 中 的 数 所 

















向 过 程 编 











居 层 相对 应 。 这 
库 中 的 表 、 行 、 列 。 我 
是 因为 它 表 达 了 一 种 物理 模型 ， 


独立 的 数据 库 服 务 进程 来 隔离 所 有 的 数据 库 
和 TF， 在 防火 墙 的 后 面 
的 一 部 分 ， 而 对 了 





模型 之 间 的 不 匹配 。 在 SQL 数据 库 中 ， 我 们 主要 侧 习 
在 大 多 数 情况 下 ， 它 





对 单 
] 数 据 库 来 














提供 














个 、 


其 是 Python : 














的 文 伯 
使 ) 




















自 


互 




















集成 的 sql 


序列 化 和 保存 一 一 JSON、YAML、Pickle、 
我 们 需要 从 一 个 大 的 领域 中 分 离 出 
F 结 构 中 。 

一 个 shelve 


独 的 对 象 可 以 


ite3 

















可 以 使 | 





] 锁 来 




















数据 池 的 并 发 更 新 ，Web 应 用 
对 持久 化 对 象 的 访问 。 


事物 。 这 意味 着 它们 可 











。 例 如 MySQL， 

















应 ) 








于 SQL 语言 的 数据 访问 层 。SQL 
程 ， 也 是 阻抗 不 匹 








于 数据 模型 












































有 是 使 

















门 会 在 SQL 数据 操作 语句 : 








;五 宇 目 
本 百 征 





的 3 个 层 














门 可 以 此 


对 象 关 系 映射 的 地 方 。 


可 以 
我 们 


面向 对 象 编 
忆 问 题 的 来 源 ， 即 关系 数据 
看 ， 如 下 所 示 。 





站 





射 为 


























它 与 数 和 








来 处 理 
四 库 中 的 表 、 
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行 和 列 有 时 是 不 同 的 。 例 如 ， 在 一 个 SQL 查询 所 返回 的 结果 中 ， 看 起 来 像 是 一 个 表 ， 但 可 
能 并 没有 涉及 数据 库 中 平行 定义 的 一 些 表 。 
@ 物理 模型 : 这 些 包括 文件 、 块 、 页 、 比 特 和 用 于 物理 存储 的 字 节 。 这 些 实体 由 管理 级 别 的 
SQL 语句 进行 定义 。 在 一 些 复杂 的 数据 库 中 ,我们 可 以 尝试 对 数据 的 物理 模型 进行 操作 从 
而 优化 性 能 。 然 而 在 SQLite 中 ， 几 乎 不 可 能 完成 。 
在 使 用 SQL 数据 库 时 ， 在 设计 时 需要 做 一 些 抉择 。 其 中 最 重要 的 决定 也 许 是 如 何 最 大 化 地 解 
决 阻抗 不 匹配 问题 ， 也 就 是 如 何 解 决 从 旧 的 SQL 数据 映射 为 Python 对象 模型 ， 有 3 种 常见 的 策略 。 
@ 完全 不 考虑 Python 的 映射 : 这 意味 着 我 们 不 对 数据 库 进 行 复杂 的 Python 对 象 的 查询 , 工作 
范围 在 一 个 完全 独立 的 SQL 框架 中 进行 ， 这 个 框架 包括 了 原子 数据 元 素 和 函数 处 理 。 使 用 
这 种 方式 就 不 必 非 常 执着 于 为 数据 库 对 象 持久 化 使 用 面向 对 象 编程 进行 设计 。 这 样 一 来 ， 我 
们 只 能 使 用 4 种 基本 的 SQLite 类 型 : NULL、INTEGER、REAL 和 TEXT， 还 有 了 Python 中 的 
datetime.date 和 datetime.datetime, 
@ 手动 映射 : 在 类 与 SQL 逻辑 模型 的 表 、 列 、 行 和 键 之 间 添 加 一 个 数据 访问 层 。 
@ ORM 层 : 下 载 安装 一 个 ORM 层 ， 用 于 完成 在 类 与 SQL 逻辑 模型 的 映射 。 
在 接 下 来 的 例子 中 ， 会 对 这 3 种 方式 逐一 进行 介绍 。 在 了 解 从 SQL 到 对 象 的 映射 前 ， 我 们 先 
看 一 下 SQL 逻辑 模型 的 一 些 细节 ， 在 此 过 程 中 会 使 用 不 映射 的 方式 来 完成 。 





























11.1.1 SQL 数据 模型 一 一 行 和 表 


SQL 数据 模型 包括 了 表 的 命名 和 








区 从 




















变 的 namedtuple。 大 人 至 上 来 看 ， 表 更 像 是 1ist。 


~ 








对 表 








当 定义 一 个 SQL 数据 库 时 ， 会 定义 一 
数据 行进 行 操作 。 对 
































INTEG 





ER、R 





EAL 


Sal 


EXT 和 BLO] 











类 似 地 ， 当 从 SQLite 数 提 
可 以 通过 为 SQLite 添加 转换 函数 来 对 转换 过 程 进行 改善 
date 和 datetime.datetime, 























些 表 


F SQLite 来 说 ，SQL 只 支持 少数 几 种 数 
B 数据 。 对 应 的 Python 
居 库 取 这 些 类 型 的 数据 时 ， 


列 的 命名 。 表 包含 了 多 行 数据 , 每 个 数据 行 像 是 一 个 不 可 














以 及 其 中 的 列 。 当 使 ) 














类 型 为 None、 





人 











大 | 











动 映射 的 方式 解决 此 问题 。 


SQL 











据 


、 上 其 














CRE 


的 列 以 及 索引 





AB 




















这 种 








'E BLOG ( 








进行 定义 。 以 下 语句 定义 了 





EGER P 








| 














'E POST ( 





























RIMARY KEY AUTOINCREMENT, 











EGER P 











IMESTAMP, 


RIMARY KEY AUTOINCREMENT, 





j 一 个 SQL 数据 库 时 ， 我 们 会 





值 类 型 。SQLite 支持 NULL、 
int、 float、 str 和 bytes。 


门 会 被 转化 为 Python 对 象 。 
。 在 sqlite3 模块 中 加 入 了 datetim 
方式 的 实现 进行 扩展 。 我 们 将 在 下 一 节 ! 

















使 用 对 











语句 可 以 被 分 为 3 类 : 数据 定义 语言 (data definition language，DDL) 、 数 据 操纵 语言 (data 
manipulation language，DML) 和 数据 控制 语言 (data control language，DCL)。DDL 运 | 
些 表 ， 是 DDL 的 一 个 例子 。 











j 于 对 数 











已 TEX 





7 

















RST_ TEX 





EXT, 





B 





FER 





ENCES BLOG 











CREATE TABLE 


D INTEGE 


AG 








LOG ID INTEGER RF 


( 


R PRIMARY KEY AUTOINCR 


11.1 


(ID) ); 








HRASE TEX 
CREATE TAB 














UNIQU 
'E ASSOC POST_ 





AG ( 














POST_ID IN 


EGI 





ER REFERENCES POST 























TAG ID INTFE 


GE 





R REFERENCES 





























我 们 








创建 了 4 张 表 来 表示 博客 应 用 
的 更 多 信息 ， 可 以 参见 http://www.sqlite.org/lang.html。 若 要 了 解 更 多 有 关 SQL 的 














AG (ID 


EMENT, 


E ON CONFLICT FAIL ); 


(ID) 
) ) 


7 
7 


的 Blog 和 Post 对 象 。 有 关 在 SQLite 中 使 用 





SQL 数据 库 、 持 久 化 和 对 象 

















1= 宙 寺内 
月 氛 ， 
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SQL 语句 
可 以 阅读 一 


些 书籍 ， 比 如 Creating your MySQL Database: Practical Design Tips and Techniqgues， 它 会 基于 MySQL 


数据 库 对 SQL 语言 进行 介绍 。SQL 语 














EE 


请 


对 Python 代码 进行 区 分 。 





司 


就 无 需 
必须 提 























BLOG 表 中 定义 了 一 
再 生成 键 值 了 。TITILI 
供 最 大 长 度 ， 而 在 SQLite 中 不 需要 ， 避 免 了 





在 POST 表 中 定义 J 





个 AUTOINCRE 





'M 




















EXT 类 型 





言 是 区 分 大 小 写 的 ， 而 我 们 比较 倾向 于 将 SQL 全 部 大 写 



































是 
长 























一 个 主键 和 日 






































我 们 并 没有 引用 标签 ， 











需要 回 到 有 关 以 下 SQL 























到 











ERENCES 语句 | 











PP 











来 表示 这 是 
最 后 ， 我 们 为 Pe0ST 和 TAG 创建 了 关联 表 。 这 个 表 





个 引用 到 自己 

















期 ， 标 题 还 有 表示 文章 内 容 的 RST 文本 。6 














。 在 一 些 数据 库 : 


， 以 


ENT 的 主键 ，SQLite 将 完成 对 主键 的 赋值 ， 这 样 在 代码 中 
5 列表 示 一 个 博客 的 标题 ， 我 们 定义 为 TI 
度 不 一 的 存储 记录 造成 的 混乱 。 

















以 注意 到 ， 在 表 




















数据 表 的 设计 模式 中 。 在 POST 表 中 包含 了 




















个 前 

















BLOG 的 外 键 。TAG 表 














、/- 














A A 
许 一 篇 文章 包含 











计 模 式 中 是 很 常见 的 ，) 




















设计 模式 ， 可 以 通 


te3 








import sqli 


database = sqlite3.connect ('p2 c] 
database.executescript( sql ddl 


过 执行 








) 





所 有 的 数据 库 访 问 需 
传 入 数据 库 连 接 中 。 我 人 























门将 对 这 个 函数 的 








要 一 个 连接 , 使 用 模块 ! 














， 只 定义 了 每 个 标签 文本 。 

















1 blog.db') 



















































































他 的 





的 函数 sqlite3.connect () 进行 创建 , 将 文件 
他 参数 在 接 下 来 的 节 中 进行 介绍 。 

















定义 
独 的 


只 有 两 个 外 键 ， 它 关联 了 标签 和 文章 ， 多 
E 限 数量 的 标签 ， 以 及 无 限 数量 的 文章 可 以 共享 一 个 标签 。 这 个 关联 表 在 SQL 设 
] 于 为 这 类 表 关系 建立 联系 。 在 接 下 来 的 儿 节 中 ,我 们 会 看 一 些 
之 前 的 定义 来 创建 数据 库 。 


SQL 





名 


并 没有 


DB-API 会 假设 应 用 程序 进程 会 连接 一 个 独立 的 数据 库 服务 进程 。 而 对 于 SQLite 来 说 ， 
一 个 独立 的 进程 。 然 而 ， 为 了 符合 标准 ， 使 用 了 connect () 函数 。 
sql_qdl 变量 只 是 一 个 长 的 字符 串 变 量 ， 其 中 包含 了 4 个 CREATE TABLE 语句 。 如 果 没 有 错 























蕊 味 着 


误 信 息 ，: 








从 技术 上 来 看 ， 数 寺 


crsr = database. 





for stmt in sql_ 


结构 被 正确 
Connection.executescript () 方法 在 Python 标 ;# 
居 库 操作 包含 了 cursor。 如 下 是 一 个 使 用 的 示例 。 








定义 了 。 














cursor() 
dol .SpLlit( "yr ) 





crsr.execute (stmt) 






































入 库 | 


























有 错 














被 描述 为 nonstandard shortcut。 
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对 为 我 们 主要 使 用 SQLite， 所 以 会 大 量 使 用 nonstandard shortcuts。 若 要 顺利 移植 
到 其 他 数据 库 ， 就 需要 严格 地 符合 DB-API。 我 们 会 在 接 下 来 几 节 的 查询 中 重新 介绍 游标 对 象 。 


11.1.2 ”使 用 SQL 的 DML 语句 完成 CRUD 

以 下 4 种 典型 的 CRUD 操作 直接 对 应 了 相应 的 SQL 语句 。 

@ 创建 操作 通过 INSERT 语句 完成 。 

@ ”查询 操作 通过 SELECT 语句 完成 。 

@ 更 新 操作 通过 UPDATE 语句 来 完成 ， 如 果 数 据 库 支 持 ， 还 可 以 使 用 REPLACE 语句 来 完成 。 

@ 删除 操作 通过 DELETE 语句 完成 。 

已 经 注意 到 了 ， 有 一 种 文本 形式 的 SQL 语法 ， 绑 定 了 变量 占 位 符 而 非 文本 值 。 对 于 脚本 来 说 ， 
文字 形式 的 SQL 语法 是 可 以 接受 的 。 然 而 ， 由 于 值 总 是 文本 ， 对 于 应 用 编程 来 说 是 非常 糟糕 的 。 
在 一 个 应 用 中 创建 文本 的 SQL 语句 涉及 大 量 的 字符 串 操 作 和 明显 的 安全 问题 。 这 里 就 有 一 个 拼凑 
SQL 文本 带 来 的 安全 问题 ，http://xkcd.com/327/， 我 们 会 重点 介绍 一 些 SQL 中 的 变量 绑 定 。 

SQL 文本 的 广泛 使 用 是 错误 的 做 法 。 






























































































































































| 










































































































































































应 该 避免 通过 字符 串 操作 创建 SQL 的 DML 语句 。 ] 

















Python 的 DB-API 接口 ， 在 Python 增强 建议 书 (Python Enhancement Proposal，PEP) 249 条 ， 
http:Wwww.python.org/devpeps/pep-0249/， 定 义 了 几 种 方式 来 将 应 用 变量 绑 定 到 SQL 语句 中 。SQLite 
可 以 使 用 ?完成 位 置 绑 定 或 使 用 :name 完成 命名 绑 定 。 接 下 来 会 对 这 两 种 绑 定 进行 一 一 介绍 。 

如 以 下 代码 段 所 示 ， 我 们 使 用 一 个 INSTERT 语句 新 建 了 一 个 BLOG 行 。 


create blog= "nn 
INSERT INTO BLOG (TITLE) VALUES (?) 
以 局/ 局 


































































































database.execute (create blog, ("Travel Blog",)) 


我 们 创建 了 一 个 SQL 语句 ， 为 BLOG 表 中 的 TITLE 列 使 用 了 一 个 位 置 绑 定 变量 ? 。 在 将 一 组 
值 绑 定 到 变量 上 之 后 ， 执 行 了 这 条 语句 。 只 绑 定 了 一 个 变量 ， 因 此 在 元 组 中 只 有 一 个 值 。 这 条 语句 
一 旦 执行 ， 在 数据 库 中 将 插入 一 行 记录 。 

可 以 看 到 ， 在 3 个 引号 内 的 SQL 语句 与 Python 代码 很 明显 地 区 分 开 了 。 在 一 些 应 用 中 ， 会 将 SQL 
保存 为 一 个 独立 的 配置 项 。 从 语句 名 到 SQL 文本 的 映射 ， 将 SQL 分 离 是 最 好 的 选择 。 例 如 ， 可 以 
将 SQL 存在 一 个 JSON 文件 中 。 这 意味 着 可 以 使 用 SoL=json.1load ("sql config.json") 来 
获取 所 有 的 SQL 语句 。 然 后 可 以 使 用 SoL ["some statement name"] 来 引用 一 个 特定 的 SQL 语句 ， 
可 以 将 SQL 控制 在 Python 代码 的 外 部 来 简化 维护 成 本 。 
使 用 DELETE 与 UPDATE 语句 时 需要 指定 一 个 WHERE 语句 来 标识 哪 一 行 需要 修改 或 删除 。 可 
以 使 用 如 下 代码 来 修改 一 个 blog 标题 。 




























































































































































































































































































update blog=""" 
UPDATE BLOG SET TITLE=:new title WHERE TITLE=:old title 


worm 





























database.execute( "BEGIN" ) 
database.execute( update blog, 

dict (new title="2013-2014 Travel", old title="Travel Blog") ) 
database.commit () 











在 UPDATE 语句 中 有 两 个 命名 的 绑 定 变量 :new title 和 :old title。 这 个 事务 会 将 BLOG 
表 中 所 有 包含 了 旧 标 题 的 行 更 新 为 新 标题 。 理 想 情况 下 ， 标 题 是 唯一 的 ， 而 且 只 有 一 行 被 修改 。SQL 
语句 的 操作 对 象 是 行 的 集合 。 数 据 库 设 计 中 很 重要 的 一 点 是 要 确保 行 的 内 容 是 由 集合 构成 的 ， 建 议 
为 每 个 表 创建 一 个 主键 。 
当 执 行 一 个 删除 操作 时 ， 会 有 两 种 选择 。 要 么 当 子 记录 仍 存在 时 阻止 对 父 记录 的 和 删除， 要么 在 
删除 父 记 录 的 同时 删除 相应 的 子 记录 。 接 下 来 的 例子 中 会 介绍 有 关 对 Blog、Post 和 标签 的 级 联 删 


除 。 以 下 是 一 些 DELETE 语句 。 
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mh 


































































































delete post tag by blog title= """ 

DELETE FROM ASSOC POST TAG 

WHERE POST ID IN ( 
SELECT DISTINCT POST ID 
FROM BLOG JOIN POST ON BLOG.ID = POST.BLOG ID 
WHERE BLOG.TITLE=:old title) 



































mnnm 


delete post by blog title= """ 
DELETE FROM POST WHERE BLOG ID IN ( 
SELECT ID FROM BLOG WHERE TITLE=:old title) 





























ww 


delete blog by title=""" 
DELETE FROM BLOG WHERE TITLE=:old title 


mn nm 

















七 TY : 
with database: 
title= dict (old title="2013-2014 Travel") 
database.execute( delete post tag by blog title, title ) 
database.execute( delete post by blog title, title ) 
database.execute( delete blog by title, title ) 
print( "Delete finished normally." ) 

















except Exception as e: 

print( "Rolled Back due to {0}".format (e) ) 

我 们 使 用 了 3 步 来 完成 删除 操作 。 首 先 ， 根 据 指定 的 Blog 标题 从 ASSoC_POST_TAG 中 删除 
所 有 的 行 。 注 意 它 是 一 个 嵌 套 查询 ， 我 们 会 在 下 一 节 中 介绍 查询 。 在 SQL 结构 中 执行 表 之 间 的 跳 转 
是 一 个 常见 的 问题 。 因 此 ， 必 须 从 BLOG-POST 关系 中 先 查 询 PosT 的 ID 来 得 到 要 删除 的 行 ， 然 后 就 
可 以 找 出 与 需要 删除 博客 的 相关 文章 了 ， 再 根据 这 些 文章 的 记录 从 ASSOC_POST_TAG 中 找 出 并 移 
除 相关 的 记录 。 下 一 步 ， 删 除 所 有 与 指定 博客 相关 的 文章 记录 。 这 也 涉及 一 个 谍 套 查询 ， 用 于 完成 
根据 标题 查询 出 所 有 相关 博客 的 ID 。 最 后 ， 删 除 博客 记录 。 

这 是 一 个 显 式 执行 级 联 删 除 的 例子 ， 操 作 需 要 从 BLOG 表 级 联 操作 两 个 其 他 的 表 。 将 所 有 的 删 













































































到 
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除 放 进 一 个 with 上 下 文中 ， 这 样 它 就 会 当 








作 同 一 个 事务 来 执行 。 如 果 执 行 失败 ， 











执行 的 修改 ， 将 数据 库 恢 复 为 执行 之 前 的 状态 。 
11.1.3 使 用 SQL 中 SELECT 语句 执行 查询 





有 关 SELECT 语句 的 内 容 ， 可 以 让 
本 的 部 分 。 我 们 的 目的 是 掌握 一 些 基本 



































在 前 面 的 内 容 里 我 们 提 到 ， 从 技术 -| 
他 DML 语句 ， 是 否 使 用 游标 并 不 是 很 重要 。 我 们 将 显 式 地 


然而 ， 对 于 碍 询 来 说 ， 游 标 主要 用 于 从 数据 库 ， 



























































以 使 用 如 下 这 样 简单 的 查询 语句 。 














"SELECT * FROM BLOG WHERE T] 


























SE 




















TLE=?" 























我 们 需要 获取 对 象 的 行 结果 集 。 尽 































































































合 。 大 致 上 来 说 ， 每 个 结果 集 是 由 SEL 
它 的 定义 由 SELECT 语句 完成 而 非 任 何 Ci 











RE 


ECT 查询 入 


了 时 只 需要 返回 





独 写 一 本 书 来 介绍 。 这 里 我 们 只 关注 S 
的 SQL 语句 ， 能 够 完成 对 数据 库 
上 来 说 ， 建 议 在 执行 SQL 语句 时 使 / 


它 将 会 回 滚 已 经 














ELECT 语句 中 最 基 


























的 查询 和 存储 即 可 。 



































ATE TABL 








取 























这 样 一 来 ， 使 用 SELECT * 



































query blog by title= """ 



































TITLE=? 





SELECT * FROM BLOG WHERE 
mnmnm 


for blog in database.exe 
Travel",) ) : 


cute( query blog by title, 


print( blog[0], blog[1] ) 









































意味 着 有 效 地 避免 了 对 
可 结果 中 包含 大 量 的 列 ， 以 下 是 对 于 使 用 SQLite 常见 的 全 





























一 个 游标 对 象 。 游 标 是 可 迭代 的 ， 
语句 中 查询 关键 字 的 行 。 





























为 了 完全 遵守 Python 中 DB-API 的 标 # 








crsr= database.cursor() 


crsr.execute( query blog by title, 


for blog in crsr.fetchal 




















它 将 迭代 返回 所 有 的 行 结果 集 ， 这 些 结果 集 包含 了 所 有 [匹配 WHERE 











下 区 六 过 


print( blog[0], blog[1] ) 














以 上 演示 了 如 何 使 用 连接 创建 























旦 完成 了 查询 的 执行 ， 就 可 以 获 
































区 行 结果 外 
































着 。 每 行 寻 





样 一 来 ， 因 为 SELECT 语句 为 *， 这 意味 着 从 原来 的 CRE 


11.1.4 SQL 事务 和 ACID 属性 





长 示 S 


EL 


("2013-2014 





住 ， 可 以 分 解 为 如 下 几 步 。 














一 个 游标 。 对 于 DDL 和 其 
创建 游标 ， 因 为 它 会 大 幅度 简化 SQL 编程 。 
获取 数据 。 根 据 标题 对 一 个 博客 进行 定位 ， 可 























行 数据 ， 但 对 SQL 而 言 ， 一 切 都 是 一 
的 集合 ， 通 常 是 一 个 包含 了 行 和 列 的 表 。 
E DDL 语句 。 
期 望 的 结果 列 进行 枚 举 。 这 或 许 会 导致 返 
化 方案 。 











在 SELECT 语句 中 ，* 人 代表 了 所 有 的 有 效 列 的 集合 。 这 种 方式 对 于 简单 的 表 来 说 是 非常 有 用 的 。 


在 SELECT 语句 中 ， 将 请 求 的 博客 标题 绑 定 如 








FE 了 "?" 参 数 上 。execute () 函数 的 执行 结果 是 























("2013-2014 Travel",) ) 








ECT 语句 所 返回 的 其 























个 游标 对 象 。 然 后 就 可 以 使 用 游标 对 象 来 执行 一 个 查询 语句 。 一 


中 一 个 元 组 值 。 这 











'ATE 





TAI 


BL 








Ee 语句 返回 








正如 我 们 所 看 到 的 ，SQL 中 DML 语句 对 应 了 CRUD 操作 。 当 讨论 SQL : 








的 






































列 将 被 使 用 。 








INSERI、S 





EL 





ECT、 UPDAT 








EE 和 D 





EL 


Ep 语句 。 





ET 











入 DML 语句 都 了 











[ 作 在 一 个 SQL 事务 的 上 下 文中 。 在 一 个 事务 | 





自 




















的 DDL 语句 (例如 ，CRE 


元 ， 整 个 事务 可 以 被 提交 或 











JATE、 

















的 事务 ， 


三 
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的 基本 
起 未 ] 


大 | 






































属性 ， 其 

















为 它们 改变 了 数 志 
指 原子 性 《Atomic)、 一 致 尾 





居 库 的 结构 。 它 人 








回 滚 ， 整 个 过 程 为 原子 操作 。 
DROP ) 不 会 在 事务 中 工人 


E (Consistent )、 隔 离 履 


11.1 























Urad 


由 





C 


门 会 隐 式 地 结束 外 





a 
类 语 


门 是 另 一 





句 ， 故 而 不 存在 事务 
E (Isolated) 和 持久 习 

















含 


有 
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SQL 











有 一 致 性 的 特性 。 


导 











事务 也 具有 隔离 性 




















已 经 提交 了 的 事务 执行 后 





的 特 ' 


ya 


生 。SQLite 中 文 持 不 同 的 隔离 级 别 ， 在 隔离 级 别 中 定义 了 SQL 的 











中 每 个 事务 中 包括 了 多 个 数据 库 操作 。 更 多 信息 可 以 











SQL 数据 库 、 持 久 化 和 对 象 




















提交 (read uncommitted ) 模式 下 ， 每 个 数据 库 链 接 所 看 到 的 数 




















E (Durable )。 它 
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执行 的 SQL 语句 是 一 个 


E 何 之 前 


们 


Shelve 


四 版 本 是 一 致 的 ， 


有 务 对 于 其 他 数据 库 客户 端 进程 来 说 通常 是 


























DML 语句 


何 基于 锁 上 





























是 如 何在 多 个 并 发 的 进程 ! 
风 定 义 进行 延迟 的 。 在 Python : 


每 个 SQL 数据 库 都 有 各 自 对 隔离 级 别 和 锁 的 处 理 
对 于 SQLite 来 说 ， 有 4 种 隔离 级 别 用 于 























交互 的 。 这 点 是 


























， 隔 离 级 别 是 在 数据 库 连 3 


于 锁 的 使 / 






































方式 ， 没有 统 






































org/isolation.html。 以 下 是 几 种 隔离 级 别 。 











定义 锁 以 及 事 






































只 包含 一 个 SQL 语句 。 






































































































































































































































E 的 。 




























































































j 以 及 一 个 SQL 请 求 的 进程 是 如 
赚 建 立时 发 4 
的 模型 。 

务 的 本 质 。 更 多 信息 可 参见 http://www.sqlite. 


isolation level=None: 这 是 默认 的 设置 ， 也 被 称 为 自动 提交 (autocommit) 模式 。 
在 这 种 模式 下 ,每 个 SQL 语句 都 会 在 执行 后 直接 提交 到 数据 库 。 它 破坏 了 原子 己 
奇怪 的 观点 则 认为 ， 所 有 的 事务 都 应 当 


E， 而 有 些 
































@ isolation level='DEFERRED': 在 这 种 模式 中 ， 事 务 中 锁 的 添加 越 晚 越 好 。 例 如 
BEGIN 语句 ， 并 没有 立即 获得 任何 锁 。 对 于 其 他 的 读 操作 〈 即 SELECT 语句 ) 可 以 获得 共 
享 锁 ， 写 操作 将 获得 保留 的 锁 。 然 而 这 样 可 以 最 大 化 并 发 ， 但 在 多 个 进程 中 也 会 产生 死 锁 。 
@ isolation level='EXCLUSIVE': 在 这 种 模式 中 , 事务 的 BEGIN 语句 会 获得 一 个 锁 ， 
阻止 其 他 操作 的 访问 。 对 于 一 些 链 接 ， 在 一 种 特殊 的 读 未 提交 模式 中 ， 忽 略 锁 会 导致 异常 。 
持久 性 对 于 所 有 已 提交 的 事务 都 是 可 以 保证 的 。 数 据 已 经 写 入 了 数据 库 文 件 中 。 

在 SQL 中 ， 需 要 使 用 BEGIN TRANSACTION 和 COMMIT TRANSACTION 来 将 括号 内 的 步骤 
包括 在 事务 中 。 出 现 错误 时 ， 需 要 使 用 ROLLBACK TRANSACTION 语句 来 进行 回 深 。 在 Python 中 的 
接口 简化 了 这 一 点 。 我 们 可 以 执行 一 个 BEGIN 语句 。 其 他 语句 由 sqlite3. Connection 对 象 中 的 
函数 来 提供 ， 不 需要 执行 SQL 语句 来 终止 一 个 事务 ， 如 以 下 代码 所 示 。 








database = sqlite3.connect ('p2 cl11 pblog.db', isolation 











level="'DE 
Ey 


FERRED'"') 





database.executel( 


"BEGIN " 


) 












































"some statement" 
"another statement™" 


) 
) 











ERRE 





EE 
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Qatabase .execute ( 
Qatabase.execute ( 
database.commit () 

except Exception as e: 
database.rollback () 
raise e 

当 建 立 数据 库 连 接 时 我 们 将 隔离 级 别 设置 为 D 

每 个 事务 。 一 个 典型 的 场景 是 ， 

下 提交 事务 , 如 果 发 生 错 误 则 回 

理 器 来 简化 这 个 过 程 。 

database = sqlite3.connect 


level="'DEF 














FERRED'"') 





with database: 


以 上 代码 与 之 前 的 例子 是 类 似 的 。 我 们 使 用 了 相同 上 





而 并 没有 


在 with 上 上 下文 
rollback () 会 被 执行 ， 然 后 异常 会 从 witn 语句 ! 


11.1.5 


SQL 表 中 


AAA 


database.execute( "som 


database.execute( "ano 


显 式 地 执行 BEGIN 语句 ， 





('P2_c11 blog.db', isolation 


e statement" ) 
ther statement" 


) 





4 方式 打开 数 
完成 这 件 事 











再 。 








Re 


上 下文 对 象 会 蔡 我 们 


























的 最 后 ，database .commit () 语句 会 自动 提交 。 


Ik 
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Do 











抛 日 


设计 数据 库 中 的 主键 和 外 键 











不 一 定 要 定义 
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于 定义 




















在 之 
一 个 约束 是 3 
E 键 值 的 错误 时 一 一 就 


«| 


个 联合 主键 ， 也 有 可 能 ; 














Le 
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] Shelve 保存 和 获取 对 象 ”中 用 
右 











上 = 键 的 设计 
个 属性 





然而 ， 表 中 没有 包含 3 
[看 到 的 ， 可 能 会 


用 安 公 


性 适合 定义 为 主键 ， 居 


主键 。 






































屋 J 
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王 何 
































的 例子 中 就 使 用 了 代理 





一 | 














E 键 .这 











E 键 不 能 被 修改 ， 
无 论 如 























了 
删除 那 





这 是 在 编程 
可 都 要 











D。 这 意味 着 我 们 需 
将 相关 的 DML 封装 在 一 个 try 语句 块 中 ， 然 后 在 没有 错误 的 情况 
滚 事务 ， 可 以 使 用 sqlite3.Connection 对 象 作为 一 个 上 下 文 管 


发 





要 显 








式 地 了 











于 始 和 结束 











用 








旨 
日 





是 非常 
或 一 些 
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守 的 规则 。 可 
















































































各 4 














的 键 果 存 在 级 联 删除 





局 录 然 后 再 使 / 








条 错误 i mn 








EF 硝 











小 ， 
























































计 方 式 。 
e@ 


在 一 个 数据 库 设 计 中 ， 在 关系 .| 


表 之 





值 ， 这 种 情况 很 复杂 。 使 用 代理 主键 可 以 避 
建 和 外 键 的 引 


已 经 介绍 了 。 在 设计 3 











间 的 所 有 关系 都 是 由 主 和 

















在 之 前 的 表 设 计 ， 






































用 完成 的 。 对 于 表 关 系 的 设计 


需要 在 

















ES 
上 里- 








|， 有 两 逢 





F 非 














关系 时 ， 

















1 对 多 : 这 种 关系 体现 在 
很 多 行将 会 引用 BLOG 表 
多 对 多 : 这 利 

TAG 的 ! 
1 对 1: 这 利 



























































ES 语 


个 博客 对 应 了 多 篇 文章 。REF 
的 一 行 。 如 果 从 子 对 父 的 引用 方 


ERENC 











人 句 江 





糕 的 。 了 
属性 的 组 合 ) 月 
Bb 么 就 必须 定义 代理 主键 。 
单 的 设计 方式 , 因为 它 对 数据 的 约束 是 最 少 的 。 
[在 一 些 情况 1 
除 约束 后 了 


| 


品 吊 /) 
有 3 种 设计 方法 ， 如 下 面 列表 所 示 。 
有 示 了 在 POST 表 : 
向 来 看 ， 这 种 关系 可 以 称 为 多 对 1。 


























关系 体现 在 多 篇 文章 与 多 个 标签 的 对 应 关系 上 。 这 将 
间 表 ;中间 表 有 两 个 (或 多 个 ) 外 键 。 多 对 多 的 中 间 表 也 可 以 包含 自己 的 
FP 关系 是 相对 少见 的 。 从 技术 上 来 看 ， 它 与 一 对 多 的 关系 没有 区 别 ; 0 行 或 者 一 行 




















的 基数 是 一 种 在 应 用 程序 ! 


必须 进行 管理 的 约束 。 















































需要 一 个 介 了 





而 女 


于 
EE 
Py 








上 可 能 会 有 这 几 种 约束 : 关系 被 描述 为 可 选 或 必 选 ， 在 关系 上 可 











做 法 


据 库 ， 然 后 进入 了 一 个 上 下 文 


生 异 常 时 ，gdatabase. 


E 如 在 





例如 ， 当 需要 
了 新建 。 男 一 利 
务 中 纠正 主键 的 








的 设 











的 





于 POST 和 
性 。 














11.2 

















ZI 































































































对 为 它 




















的 一 部 分 ， 在 SQLite 数据 库 
























































们 是 被 数据 库 服 务 器 强制 的 ， 而 对 关系 约束 的 检测 失败 可 能 会 导致 条 种 错误 。 








隐 式 : 这 些 关系 只 在 
可 以 注意 到 ,在 表 定 义 中 实现 了 1 对 多 的 关系 ， 建 立 在 








写 的 多 个 查询 中 我 们 / 












































查询 中 体现 ， 它 们 不 是 DDL ' 


























j 到 了 这 些 关系 。 


11.2 使 用 SQL 处 理 程序 中 的 数据 





































































































正式 的 部 分 。 
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会 有 基数 限制 。 有 时 ， 这 些 可 选 或 者 基数 限制 被 概括 地 描述 为 “0:m”， 兽 # 着 “0 对 多 ”或 “可 选 
的 1 对 多 ” 可 选 性 和 基数 约束 是 应 用 编程 逻辑 : 
其 进行 陈述 。 在 数据 库 中 ， 基 本 表 关 系 可 以 通 ; 

@ 显 式 : 可 以 称 之 为 已 定义 的 ， 





并 没有 正式 的 说 法 来 对 
过 以 下 一 种 或 两 种 方式 来 实现 。 


门 是 数据 库 中 DDL 定义 的 一 个 部 分 。 理 想 情况 下 ， 它 








博客 与 博客 中 的 多 条 记录 之 间 。 在 之 前 









































在 前 面 几 节 介 绍 的 例子 中 ， 演 示 了 SQL 的 处 理 过 程 。 我 们 没有 在 问题 领域 中 使 用 任何 面向 对 
象 设 计 。 我 们 使 用 了 SQLite 中 可 以 处 理 的 数据 元 素 : 字符 串 、 日 期 、 浮 点 数 和 整 型 数值 ， 而 并 没 
有 使 用 Blog 和 Post 对 象 。 我 们 基本 在 使 用 过 程式 的 编程 风格 进行 设计 。 














可 以 看 到 ， 可 以 使 用 一 些 查 询 来 完成 一 篇 博客 和 该 博客 ， 
相关 的 所 有 标签 。 这 个 过 程 可 能 会 像 如 下 代码 这 样 。 
































query blog by title= """ 


SELECT 
mm nm 
query | 


SELECT 


mn nm 








query_ 
SELECT 
FRO 
WHE 


mn nm 


TAG.* 











RE 


* FROM BLOG WHERE TITLE=? 








post by blog id= """ 





* FROM POST WHE 





RE 





BLOG ID=? 





tag by post id= "nn 





TAG JOIN ASSOC POST TAG ON TAG.ID = ASSOC POST TAG.TAG ID 
ASSOC POST TAG.POST ID=? 


for blog in database.execute( query blog by title, ("2013-2014 





Travel 


i 
print( 


"Blog", blog ) 
for post in database.execute( query post by blog igd, 


print( "Post", post ) 


for tag in database.execute( query tag by post id 


print( 


"Tag", tag ) 


(blog[0],) ): 


(Post [0],) 











的 所 有 文章 的 查找 ， 以 及 与 这 些 文 章 


我 们 定义 了 3 个 SQL 查询 语句 ， 第 1 个 会 根据 标题 查询 博客 。 对 于 每 个 博客 我 们 都 获取 所 有 




















属于 这 个 博客 的 文章 。 最 终 ， 获 取 与 给 定 文章 相关 的 所 有 标签 。 
第 2 个 查询 隐 式 地 重复 了 REF 




















PRE 





INC 














要 查询 一 个 指定 博客 父 对 象 的 所 有 子 文章 ， 因 此 需要 如 








第 3 个 查询 












































ES 的 定义 ， 它 建立 在 POST 表 和 

















包含 了 一 种 关系 的 连接 , 在 ASSOC_POST_TAG 表 和 TAG 














了 表 之 间 的 外 键 引用 ， 








WH 





PRE 








BLOG 表 之 间 的 引用 。 由 于 
FE 查询 中 重复 一 些 表 的 定义 。 

















表 之 间 。JOIN 语句 再 

















; 语句 也 会 在 表 定义 中 重复 地 定义 一 个 RE 


'F ERE 





ES 语句 。 





'NC 








次 定义 


244 第 11 章 用 SQLite 保存 和 获取 对 象 























于 多 张 表 的 关系 是 在 第 3 个 查询 中 连接 起 来 






























































由 于 我 们 只 关心 TAG 表 中 的 属性 ， 医 














的 ， 因 此 使 用 SELECT * 将 会 查询 这 些 表 的 全 部 列 。 











此 只 要 使 用 SELECT TAG.* 来 对 所 需要 的 列 进行 查询 就 可 以 了 。 





























杂 的 类 定义 ， 我 们 必须 基于 所 返 世 



































法 时 ， 为 了 使 用 更 完整 的 Python 类 定义 ， 我 们 需要 一 种 更 好 的 从 SQL 到 Python 的 映射 。 


























这 些 查 询 会 返回 所 有 的 比特 和 数据 块 ， 然 而 这 些 碍 询 并 不 会 重新 创建 Python 对象。 如 果 有 更 复 
为 








的 数据 块 来 创建 对 象 。 特 别 是 当 Python 类 定义 中 有 很 重要 的 广 


























在 纯 SQL 中 实现 类 似 于 类 的 处 理 方式 








现在 看 一 个 更 复杂 的 Blog 类 的 定义 ， 这 个 定义 在 第 9 章 “ 序 列 化 和 保存 一 一 JSON、YAML、Pickle、 
CSV 和 XML” 中 介绍 过 。 这 里 只 关心 一 个 方法 ， 在 以 下 代码 中 已 经 高 亮 出 来 了 。 


from Collections import defaultdict 





class Blog: 








def _init ( self, title, *posts ): 


self.title= title 


self.entries= list (posts) 


def append!( self, post ) : 
self.entries.append (post) 


def by tag (self): 


tag index= defaultdict (list) 
for post in self.entries: 
for tag in post.tags: 


tag index 
return tag index 
def as dict( self ) : 
return dict( 


[tag] .append( post ) 


title= self.title, 


underline= "= 


"xlen(selEfE .title)y 


entries= [p.as dict() for p in self.entries], 


) 





一 个 博客 的 blog .by_tag () 功能 在 SQL 查询 中 会 变 得 相当 复杂 。 因 为 使 用 的 是 面向 对 象 编程 ， 


它 简化 了 这 个 过 程 ， 在 一 个 Post 实例 中 和 迭代， 创建 defaultdict， 在 它 上 
到 一 个 Posts 序列 的 映射 ， 这 些 文章 会 共享 这 个 标签 。 以 下 代码 使 用 SQL 查询 做 了 同样 的 事 ' 





query by tag= wan 











OIN BLOG ON POST.BLOG ID 
HERE BLOG.TITLE=? 


mn nm 





局 












































在 这 个 查询 结果 集中 包含 了 一 个 由 行 的 序列 所 组 成 的 表 ， 包 括 了 3 个 属性 : TAG .PHRASE、 
POST .TITLE 和 POST.ID。 每 个 PosT 标题 和 POST ID 将 会 和 所 有 相关 的 TAG 重复 出 现 。 为 了 使 用 
更 简单 且 对 于 HTML 友好 的 方式 来 表示 ， 我 们 需要 将 包含 了 相同 TAG .PHRASE 的 行 分 组 为 同一 个 附属 









































列表 ， 如 以 下 代码 所 示 。 









































B 面 完成 了 从 每 个 


所 

















ELECT TAG.PHRASE, POST.TITLE, POST.ID 
ROM TAG JOIN ASSOC POST TAG ON TAG.ID = ASSOC POST TAG.TAG ID 
OIN POST ON POST.ID = ASSOC POST TAG.POST ID 





= BLOG.ID 
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tag index= defaultdict (1ist) 

for tag post title, post id in database.executel( query by tag, 

("2013-2014 Travel",) ): 

tag index[tag] .append( (post title, post id) ) 

print( tag index ) 

这 个 额外 的 过 程 会 将 POST 标题 和 POST ID 的 两 个 元 组 放 入 一 个 结构 中 ， 它 可 以 被 有 效 地 用 于 
生成 RST 和 HTML 的 输出 结果 。SQL 查询 加 上 Python 的 处 理 过 程 显得 非常 繁琐 一 一 比 内 部 面向 对 
象 的 Python 还 要 繁琐 。 
更 重要 的 是 ，SQL 查询 与 表 定义 无 关 。SQL 不 是 一 种 面向 对 象 编程 语言 ， 并 没有 一 个 将 数据 
和 处 理 过 程 融 合 在 一 起 的 类 。 使 用 像 SQL 这 样 的 过 程式 编程 语言 时 ， 将 完全 无 法 使 用 面向 对 象 纺 
程 。 从 一 种 严格 的 面向 对 象 编程 的 视角 来 看 ， 我 们 会 标记 为 “重大 失败 ”。 

有 很 多 观点 建议 ， 在 处 理 特定 的 问题 时 ， 使 用 这 种 大 量 使 用 SQL 而 且 没 有 任何 对 象 的 编程 方 
式 比 使 用 Python 更 合适 。 通 常 ， 这 种 问题 包含 了 SQL 的 GROUP BY 语句 。 然 而 在 SQL 中 很 方便 
在 Python 中 ， 通 过 aefaultdict 和 Counter 提供 的 实现 也 同样 非常 高 效 。 对 于 在 一 个 小 程序 中 
查询 大 量 行 的 场景 ， 使 用 Python 的 defaultqict 的 实现 方式 会 比 在 数据 库 中 使 用 SQL 的 GROUP BY 
语句 的 实现 方式 更 高 效 。 当 有 不 确定 的 情况 时 ， 最 好 测试 一 下 。 当 数据 库 管 理 员 说 到 使 用 SQL 非 
常 快 时 ， 需 要 测试 一 下 才能 确定 。 


11.3 从 Python 对 象 到 SQLite BLOB 列 的 映射 






































































































































































































































































































































































































































我 们 可 以 将 SQL 列 映射 为 类 的 定义 ， 这 样 一 来 就 能 够 基于 数据 库 中 的 数据 来 构造 适当 的 Python 
对 象 。SQLite 中 包含 了 一 个 二 进 制 大 对 象 (Binary Large Object，BLOB) 数值 类 型 。 我 们 可 以 
] pickle 来 处 理 Python 对 象 ， 然 后 将 它们 存 入 BLOB 列 中 。 可 以 使 用 字符 串 来 表示 Python 
| 象 〈 例 如 ， 使 用 JSON 或 YAML 格式 )， 也 可 以 使 用 SQLite 中 的 文本 列 。 

在 使 用 这 种 技术 时 应 当 谨 慎 ， 因 为 它 很 容易 会 妨碍 SQL 的 处 理 过 程 。 一 个 BLOB 列 无 法 用 于 
SQL 中 DML 的 处 理 。 我 们 无 法 为 它 建立 索引 或 用 在 DML 语句 中 的 查找 关键 字 中 。 
当 不 需要 考虑 SQL 处 理 过 程 的 透明 度 时 ，SQLite 的 BLOB 映射 过 程 应 在 对 象 中 完成 。 最 常见 的 例子 
是 媒体 对 象 ， 例 如 视频 和 图 片 或 语音 片段 。SQL 偏向 于 文本 和 数字 字段 。 它 通常 不 会 处 理 更 复杂 的 对 象 。 
当 需 要 处 理 金融 数据 时 ， 在 应 用 程序 中 需要 使 用 decimal .Decimal 数值 。 可 能 会 希望 在 SQL 
中 查询 或 计算 这 类 数据 。 由 于 decimal .Decimal 并 没有 被 SQLite 直接 支持 ， 需 要 对 SQLite 进行 
扩展 来 处 理 这 种 类 型 的 数据 。 

存在 这 样 两 种 方式 ;转换 和 适 配 。 我 们 需要 对 Python 的 数据 进行 适 配 ， 存 入 SQLite 需要 将 
SQLite 中 的 数据 转换 到 Python 中 。 以 下 为 这 两 种 函数 以 及 用 于 完成 注册 的 代码 。 


import decimal 











全 
































3 























































































































































































































































































































def adapt currency (value): 
return str(value) 
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sqlite3.register adapter (decimal .Decimal, 


def convert currency (bytes): 
return decimal.Decimal (bytes.decod 
ECIMAL", 





sqlite3.register converter("D 


adapt currency) 


e()) 


convert currency) 


























我 们 写 了 一 个 adapt_currency () 函数 ， 
库 中 适当 的 形式 。 在 以 上 例子 中 ， 我 们 只 是 做 了 
因此 SQLite 接口 就 能 够 使 用 所 注册 的 适 配 函 

我 们 也 写 了 一 个 convert _currency () 
decimal.Decimal 对 象 。 
Python 中 的 对 象 。 

一 旦 定义 了 适配器 和 转化 器 ， 我 们 就 能 将 DE 















































由 于 六 

















能 将 DE 
在 建立 数据 库 连 接 时 通过 设置 detect_ types= 
是 定义 的 例子 ， 其 中 包含 了 使 用 新 数值 关 


无 
CREATE TABLE BUDGET ( 
year INTEGER, 
month INTEGER, 
Category TEXT, 
amount DECIMAL 








sql 
类 天 















































2 
































) 
我 们 可 以 像 这 样 来 使 用 新 列 。 


te3.connect ( 
S ) 
tel 





database= sqli 
PARSE DECLTYPE 
database.execu 

















decimal ddl ) 


wn 
DGI 
:Category, 


insert budget= 
INSERT INTO BU 
:month, 


ww 





ET (year, month, catego 


:amount) 
database.execute( insert budget, 
2013, month=1, 


一 个 到 字符 串 的 转换 。 
数 来 完成 decimal .Decima 
注册 TT 转换 函数 ， 


"P2_c11 blog.db', 


于 完成 将 decimal .Decimal 对 象 适 配 为 数据 
F 己 经 注册 了 适 配 函 数 ， 

1 类 对 象 的 转换 逻辑 了 。 

用 于 从 SQLite 字 节 对 象 转换 为 Python 中 的 
此 DECIMAL 类 型 的 列 就 能 被 适当 地 转换 为 













































































CIMAL 看 作 一 种 被 完全 支持 的 列 类 型 。 除 此 之 外 ,还 要 











ES 来 通知 SQLite。 如 下 


F 


PRARSE _ 





te3, 
型 的 列 。 


DECLTYP 





detect types=sqlite3. 


ry, amount) VALUES(:year, 


amount=decimal. 





dict (year= 
Decimal('256.78"')) 
database.executel 

dict (year=2013, month=2, 
由 


) 
insert budget, 





Decimall( 


query budget= """ 
SELECT * FROM BUDG 


mn nm 





ET 











for row in database.executel( 


) 


query_bud 


print( row 


category="fuel", 


category="fuel", 


amount=decimal. 


Get ): 








我 们 创建 了 一 个 数据 库 连 接 ， 需 要 定义 的 类 型 
能 在 创建 表 时 使 用 一 个 DECIMAL 类 型 的 列 。 
当 插入 行 时 ， 我 们 使 ) 


妆 回 表 ' 




































































] 了 decimal.Decimal 对 象 。 当 





旦 创建 了 连接 ， 就 


通过 转换 函数 来 完成 映射 。 





从 表 中 获取 行 时 ， 可 以 看 到 我 











11.4 手动 完成 

















们 从 数据 库 中 拿 到 了 decimal .Decimal 对 象 。 如 下 是 输出 结果 。 
(2013, 1, ‘'fuel', Decimal('256.78')) 
(2013, 2, 'fuel', Decimal ('287.65')) 











以 上 代码 表明 qecimal .Decimal 对 象 被 正确 地 从 数 志 
Python 类 编写 适配器 和 转化 器 ， 可 能 也 需要 创建 一 种 二 进 制 的 表示 。 由 本 














容易 ， 因 此 直接 使 用 字符 串通 常 是 最 简单 的 方式 。 












































库 中 储存 并 当 
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取 。 我 们 可 以 为 任何 


F 从 字符 串 转换 到 二 进 制 很 





11.4 手动 完成 从 Python 对 象 到 数据 库 中 行 的 映射 














我 们 可 以 将 SQL 的 行 映射 为 类 定义 ， 这 样 就 可 以 基于 数据 库 的 数据 创建 适当 的 Python 对 象 实例 。 如 





























果 讶 慎 处 















































询 。 在 面向 对 象 涉 及 与 SQL 数据 库 ! 




















我 们 需要 修改 类 定义 来 更 好 地 与 SQL 实现 相 结合 。 





还 会 对 Blog 和 Post 类 定义 做 一 些 修改 。 
以 下 是 一 个 Blog 类 的 定义 。 


from collections import defaultdict 





class Blog: 
def init ( self, **kw ): 
"""Reduires title"™"" 
self.id= kw.pop('id', None) 
self.title= kw.pop('title', None) 
if kw: 
self.entries= list() 


raise TooManyValues( kw ) 
# ??? 
def append!( self, post ) : 
self.entries.append (post) 
def by tag(self): 
tag index= defaultdict (1List) 
for post in self.entries: # ??? 
for tag in post.tags: 





























在 第 10 “) 








tag index[tag] .append( post ) 


return tag index 
def as dict( self ) : 
return dict( 
title= self.title, 
underline= 
entries= [p.as qict() 
) 

















将 一 个 数据 库 ID 作为 对 象 的 第 1 级 是 允许 的 。 进 












































"="*len (self.title), 
for p in self.entries], 


步 说 ， 我 们 修改 了 初始 化 过 程 ， 
字 。 每 个 关键 字 的 值 来 自 kw 参数 。 再 有 额外 的 值 则 会 触发 TooManyValues 异常 。 
还 有 两 个 问题 的 答案 仍 没有 得 到 ， 如 何 处 理 一 个 博客 所 对 应 的 文章 列 寻 


志 


里 数据 库 和 类 定义 ， 该 过 程 不 会 非常 复杂 。 然 而 ， 如 果 不 够 谨慎 ， 可 能 构造 出 的 Python 对 象 的 
SQL 表示 逻辑 就 会 非常 复杂 。 复 杂 度 的 其 中 一 个 因素 是 石 
所 规定 的 约束 之 间 找 到 平衡 。 


E 对 象 和 数据 库 行 之 间 的 映射 包含 了 大 量 的 查 











Shelve 保存 和 获取 对 象 ”中 


完全 基于 关键 

















我 们 会 修改 如 下 的 类 
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来 添加 这 个 功能 ， 以 下 是 一 个 Post 类 的 定义 。 


Import datetime 
Class Post : 
def init ( self, **kw ) : 


"""Requires date, title, rst text.""" 


self.id= kw.pop('id', None) 


self.date= kw.pop('date', None) 
self.title= kw.pop('title', None) 
self.rst text= kw.pop('rst text', None) 
self.tags= list() 


if kw: raise TooManyValues( kw ) 
def append( self, tag ) : 
self.tags.append( tag ) 
def as dict( self ) : 
return dict( 
date= str(self.date), 
title= self.title, 





underline= "-"*l]len(self.title), 
rst text= self.rst text, 
tag text= " ".join(self.tags), 


) 





+ 























过 程 ， 完 全 基于 关键 字 。 如 下 是 异常 类 的 定义 。 


class TooManyValues ( Exception ) : 











Pass 





为 对 于 Blog 而 言 ， 我 们 会 将 数据 库 ID 作为 对 象 第 


1 级 的 一 部 分 。 进 而 ， 我 们 修改 了 初始 化 











一 旦 完成 了 类 定义 ， 需 要 写 一 个 访问 层 用 于 完成 在 数据 库 与 类 对 象 之 间 的 数据 转换 。 这 个 访问 
层 将 提供 一 个 更 复杂 的 实现 版 本 ， 用 于 完成 Python 类 到 数据 表 中 行 的 转换 和 适 配 。 



































11.4.1 为 SQLite 设计 一 个 访问 层 















































于 本 例 的 对 象 模型 很 小 ， 因 此 可 以 在 一 个 简单 的 类 

















完成 整个 访问 层 的 实现 。 这 个 类 中 将 包含 


























一 些 方法 ， 用 于 每 个 持久 化 类 的 CRUD 操作 。 在 更 大 的 应 | 











中， 我 们 需要 对 访问 层 进行 解 午 ， 并 针对 























每 个 持久 化 类 将 它 分 为 各 自 的 策略 类 。 然 后 会 统一 放 在 一 个 访问 层 中 ， 这 一 层 可 以 是 外 观 模式 或 是 封装 。 

















以 下 例子 并 不 会 包括 访问 层 中 所 有 方法 完整 的 实现 ， 























只 会 介绍 一 些 重要 的 信息 。 我 们 会 将 其 分 














为 几 个 不 同 的 节 来 介绍 Blogs、Posts 和 和 迭代 器 ， 以 下 是 访问 层 的 第 1 部 分 。 





Class Access : 
get_ last id= """ 
SELECT last insert rowid() 


mn nm 





def open( self, filename ) : 


self.database= Sqlite3.connect ( filename ) 
self.database.row factory = sqlite3.Row 


def get blog( self, id ) : 
query blog= """ 
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SELECT * FROM BLOG WHERE ID=? 


mn nm 





row= self.database.execute( query blog, (id,) ) .fetchone () 
blog= Blog( id= row['ID'], title= row['TITLE'] ) 
return blog 
def add blog( self, blog ) : 
insert blog= """ 
INSERT INTO BLOG (TITLE) VALUES (:title) 


mnnm 

















self.database.execute( insert blog, dict (title=blog.title) ) 
row = self.database.execute( get last id ) .fetchone () 
blog.id= row[0] 

return blog 














在 这 个 类 中 ， 设 置 了 Connection.row factory 为 sqlite3.Row 类 ， 而 不 是 一 个 简单 的 元 
组 ，Row 类 人 允许 通过 数字 索引 和 列 名 来 访问 

get_blog () 方法 从 所 获取 的 数据 库 行 中 构造 了 一 个 Blog 对 象 。 因 为 我 们 使 用 的 是 
salite3 .Row 对 象 ， 因 此 可 以 通过 名 字 来 引用 列 。 这 次 可 以 看 出 SQL 和 了 Python 类 之 间 的 映射 关系 。 

aqdd_ blog () 方 法 基于 blog 对 象 ， 向 BLOG 表 中 插入 了 一 行 记 录 。 这 个 操作 分 为 两 步 : 首先 ， 
创建 新 行 ， 然 后 执行 一 个 SQL 查询 来 获取 新 行 的 ID。 

注意 ， 表 定义 中 使 用 了 INTEGER PRIMARY KEY AUTOINCREMENT。 因 此 ， 表 的 主键 会 和 新 
行 的 ID 相 匹 配 并 且 新 行 的 ID 可 以 通过 last_insert_rowid() 函数 来 获取 。 这 样 我 们 就 能 拿 到 所 
分 配 的 新 行 ID， 进 而 可 以 存在 Python 对 象 中 并 为 之 后 的 使 用 作 准 备 。 以 下 代码 中 演示 了 我 们 如 何 从 
数据 库 中 获取 一 个 单独 的 Post 对象。 

def get post( self, id ): 


query post= """ 
SELECT * FROM POST WHERE ID=? 

















o 


























站 


































































































































































































row= self.database.execute( query post, (id,) ) .fetchone() 
post= Post( id= row['ID'], title= row['TITLE'], 
date= row['DATE'], rst text= row['RST TEXT'] ) 




















query tags= """ 

SELECT TAG.* 

FROM TAG JOIN ASSOC POST TAG ON TAG.ID = ASSOC POST TAG.TAG ID 
WHERE ASSOC POST TAG.POST ID=? 


mnmnn 




















results= Self.dqatabase.execute( query tags, (id,) ) 
for id, tag in results: 
post.append( tag ) 
return post 
为 了 创建 Post， 需 要 做 两 个 查询 。 首 先 ， 从 POST 表 中 获取 一 行 记录 来 创建 Post 对 象 的 一 
部 分 。 然 后 ， 从 TAG 表 中 查询 所 引用 的 记录 。 这 一 步 用 于 创建 与 Post 对 象 相关 的 标签 列表 。 
当 保 存 一 个 Post 对 象 时 ， 通 常 包 括 几 个 部 分 。 先 要 向 POST 表 中 添加 一 条 记录 。 并 且 ， 需 要 向 
ASSOC_POST_TAG 表 中 添加 所 连接 的 行 。 如 果 一 个 标签 是 新 的 ， 那 么 就 需要 向 TAG 表 中 添加 一 行 。 如 

























































































































































































果 标 签 已 经 存在 ， 那 么 只 需 更 新 文章 所 引用 的 标签 ID 。 以 下 是 aqd_post () 


def aqq post ( self, blog, post ) : 
insert post=""" 
INSERT INTO POST (TITLE, DATE, RST TEXT, BLOG ID) 
VALUES (:title :date, :rst text, :blog id) 

















mn nm 


query tag= mmnm 
SELECT * FROM TAG WHERE PHRASE=? 


mn nm 








insert 七 ag= """ 
INSERT INTO TAG (PHRASE) VALUES (?) 


mn nm 





insert association= """ 
INSERT INTO ASSOC POST TAG (POST ID, TAG ID) VALUES (:Pos 


mn nm 

















with self.database: 
self.database.execute( insert post, 
dict (title=post.title, date=post.date, 
rst text=post.rst text, blog id=blog.id) ) 


方法 的 实现 。 


t id,:tag id) 


row = self.database.execute( get last id) .fetchone () 


post.id= row[0] 
for tag in post.tags: 


tag row= self.database.execute( query tag, (tag,) 


) .fetchone () 
if tag row is not None: 
tag id= tag row['ID'] 
else: 
self.database.execute (insert tag, (tag,)) 
row = self.database.execute( get last id 
) .fetchone () 


tag id= row[0] 
self.database.execute (insert association, 
dict (tag id=tag id,post id=post.id)) 
return 万 Cs 七 


对 于 发 布 一 篇 文章 的 操作 ， 数 据 库 
POST 表 中 创建 新 行 ， 也 可 以 使 用 通用 的 get_last_ig 查询 来 返回 新 插入 的 P 
























































分 为 这 么 几 个 SQL 步骤 。 可 以 使 用 insert_post 语句 在 





OST 行 所 对 应 的 主键 。 




















query_tag 语句 用 于 查询 标签 在 数据 库 中 是 否 已 存在 。 如 果 查 询 结果 不 为 None， 说 明 找 到 


















































了 一 个 TAG 行 ， 并 且 这 行 的 ID 也 是 存在 的 。 否则 ， 必 须 先 使 用 insert_tag 语句 创 









































使 用 get_1last_ig 查询 来 获取 所 分 配 的 ID。 
在 ASSOC _POST_TAG 表 中 的 记录 关联 了 POST 和 相关 的 标签 。insert 
了 所 需 的 行 。 以 下 是 两 种 不 同 风 格 的 查询 ， 用 于 查找 blogs 和 posts。 


def blog iter( self ) : 
query= wo 
SELECT * FROM BLOG 


















































新 行 ， 然 后 











_association 语句 创建 


def 


post iter()} 


用 
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results= Selft.dqatabase.execute( query ) 


for row in resu 
blog= Blogl( 
yield blog 


J 


id= rowl[ 


post iter( self, blog ): 


query= mnmn 
SELECT ID FROM 

















'ID'], title= row['TITLE'] ) 


POST WHERE BLOG ID=? 


results= self.database.execute( query, (blog.id,) ) 


for row in resu 


tS 


yield self.get post( row['ID'] ) 


blog_iter() 方 法 查找 了 所 有 的 
































进一步 优化 的 。 


实现 容器 的 关系 
我 们 所 定义 的 blog 类 包含 了 两 个 功能 ， 它 们 需要 获取 博客 内 的 所 有 文章 。Blog.entries 属性 和 


11.4.2 





为 了 实现 这 个 功能 ， 
post_iter () 方 法 来 实现 













































































@ 
@ 将 Access 对 象 注 
据 库 中 相关 联 的 对 象 进行 操作 。 
羽 为 每 个 数据 库 相 关 的 对 象 都 
于 这 个 开 
对 象 创建 的 。 
多 
[4 
工厂 外 部 创建 好 的 
@ 














日 将 _ access 属性 汶 











于 查找 出 与 一 个 BLOG ID 相关 的 所 有 POST ID。POST ID 将 被 get_post () 方 法 
于 创建 Post 实例 。 由 于 get_post () 对 POST 表 执 行 另 外 一 个 查询 ， 因 此 这 两 个 方法 还 是 可 以 被 
























































BLOG 行 并 且 基 于 这 些 行 创建 blog 实例 。 







































































Blog .by_tag() 方 法 中 都 做 了 假设 在 一 个 博客 中 包含 了 完整 的 文章 实例 的 集合 。 

Blog 类 必须 考虑 到 Access 对 象 ， 这 样 它 就 可 以 使 用 Access . 
Blog.entries， 对 此 我 们 有 两 种 设计 方式 。 
合用 一 个 全 局 的 Access 对 象 可 以 简单 有 效 地 工作 ,我 们 必须 要 确保 全 局 的 数据 库 连接 被 
正确 地 打开 了 ， 而 有 时 使 用 全 局 的 Access 对 象 也 会 带 来 一 些 挑战 。 

入 需要 保存 的 Blog 对 象 中 。 这 种 方式 会 麻烦 些 ， 因 为 需要 对 每 一 个 数 






















































































| Access 类 来 创建 Access 类 的 设计 需要 使 用 工厂 模式 ， 对 
可 以 考虑 3 点 需要 改动 的 地 方 。 以 下 几 点 可 以 确保 一 个 博客 或 文章 是 由 激活 的 Access 























每 个 return blog 语句 需要 扩展 为 blog._access = self; return blog ， 需 要 

















在 get_blog()、add blog() 和 blog iter() 中 做 这 个 改动 。 








FE 入 到 每 个 














每 个 return post 语句 需要 扩展 为 post. access = self; return post， 需要 
在 get post()、 add post() 和 post iter()! 做 这 个 改动 。 
区 改 add_blog () 方法 ,可 以 接收 参数 来 创建 Blog 对象 ， 而 不 是 直接 接收 一 个 在 Access 
Blog 或 Post 对 象 。 定 义 可 能 会 是 def add blog (self，, title):。 
网 改 adg_post () 方法 ， 接 收 一 个 博客 对 象 和 一 些 参数 来 创建 一 个 Post 对 象 。 定 义 可 能 看 起 
来 是 def add post (self, blog, title, date, rst text, tags):。 
































Blog 实例 中 ， 代 码 如 下 所 示 。 
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做 法 
索引 


@property 
def entries ( 


self ) : 


return self. access.post iter( self ) 





























这 将 返回 一 个 博客 所 对 应 的 文章 列表 。 这样 就 可 以 在 类 定义 中 创建 一 些 方 法 , 用 于 人 处理 父 子 关 
系 的 对 象 ， 就 好 像 它 们 包含 在 对 象 的 内 部 一 样 。 


11.5 使 用 索引 提高 性 能 






































要 优化 一 种 关系 数据 库 ， 比 如 优化 SQLite 性 能 的 方法 之 一 是 提高 连接 操作 的 速度 。 最 好 的 
是 包含 足够 多 的 索引 
的 话 ， 在 行 查 找 时 整 表 都 必须 被 读 完 。 而 创建 了 索引 ， 只 有 相关 的 行 才 会 被 读 取 。 








由 





ZE 


忠 ， 这 样 对 于 慢 的 搜索 操作 在 查找 匹配 的 行 时 就 不 会 完成 。 没 有 



































当 我 们 在 查询 | 














定义 


列 执行 查询 时 ，SQL 数据 库 会 使 用 索引 。 当 数据 被 创建 、 修 改 或 删除 时 ， 索 引 会 自动 做 相应 调整 。 
索引 会 带 来 额外 的 存储 和 计算 的 开销 。 如 果 一 个 索引 很 少 用 至 





添加 更 多 的 SQL DDL 语句 。 














CREATE INDEX 





定义 一 个 需要 用 到 的 列 时 , 就 可 以 考虑 为 这 个 列 创建 一 个 索引 。 这 意味 着 向 表 




















索引 存储 在 一 个 单独 的 地 方 ， 但 是 它 与 指定 表 和 列 是 绑 定 的 ，SQL 代码 如 下 所 示 。 

















IX BLOG TITLE ON BLOG ( TITLE ); 























这 会 在 blog 表 的 title 列 上 创建 一 个 索引 ， 此 外 不 会 做 任何 其 他 事情 。 在 针对 所 创建 索引 的 
























































， 那 么 创建 和 维护 它 就 显得 非常 


Ws 





























昂贵 ， 它 就 会 成 为 性 能 上 的 阻力 而 非 动力 。 另 一 方面 ， 有 些 索引 非常 重要 ， 它 们 会 带 来 显 闭 的 性 能 





提升 

然后 来 权衡 它 可 能 产生 的 影响 。 
对 于 有 些 情况 ， 

类 规则 会 有 清 虽 
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库 中 创建 代 到 


。 在 所 有 索引 中 ， 我 们 无 法 改变 数据 库 
























































创建 索引 所 使 用 的 算法 ， 我 们 所 能 做 的 就 是 创建 索引 


















































将 一 个 列 定义 为 键 可 能 会 导致 索引 被 自动 创建 。 在 数据 库 的 DDL 部 分 对 这 











的 描述 。 对 于 SQLite 来 说 ， 描 述 如 下 。 


























大 多 数 情 况 下 ， 








通过 在 数据 库 中 创建 一 个 unique 索引 来 实现 UNIQUE 和 PRIMARY KEY 的 约束 。 











有 两 种 异常 。 其 中 之 一 就 是 ， 整 数 的 主键 异常 ， 发 生 在 我 们 所 介绍 的 一 种 设计 中 ， 强 制 在 数据 



































键 。 因 此 ， 数 字 主 键 就 不 会 创建 任何 索引 。 


6 添加 ORM 层 


有 许多 有 关 Python 的 ORM 项 目 ， 从 https://wiki.python.org/moin/HigherLevelDatabase Programming 
可 以 找到 一 个 列表 。 








我 们 会 选择 其 中 的 一 个 作为 例子 ， 这 时 我 们 选择 SQLAlchemy， 因 为 它 提供 给 我 们 许多 功能 

















它 的 使 用 相对 广泛 。 


己 的 





ORM 会 更 简便 一 些 。 




























































































正如 其 他 事物 一 样 ， 没 有 最 好 的 选择 ， 毕 竞 其 他 的 ORM 也 都 有 各 自 的 优 缺 点 。 





于 在 Web 开发 中 关系 数据 库 使 用 的 广泛 性 ，Web 框架 通常 会 白带 ORM 层 。Django 有 它 自 












































ORM 层 ，web.py 也 是 如 此 。 在 一 些 情况 下 ， 可 以 将 ORM 移 到 框架 的 外 面 ， 使 用 一 个 独立 的 
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有 关 SQLAlchemy 的 文档 、 安 装 说 明和 代码 可 以 在 这 里 找到 :，http://www.sqlalchemy.org。 在 安装 




















时 ， 如 果 对 很 高 的 性 能 没有 特殊 要 求 ， 可 使 / 





























SQLAlchemy 可 以 完全 将 应 用 























著 的 优势 。 我 们 可 以 只 使 ) 


























] 一 种 



































了 ， 毕 竞 它 也 只 是 数据 访问 层 的 一 部 分 。 如 此 
然而 ， 它 并 不 意味 着 可 以 不 必 弄 






























































束 。ORM 层 并 不 意味 着 设计 上 什么 都 不 用 考虑 ， 


] ORM 时 ， 需 要 在 根本 上 改变 设计 的 方法 3 























描述 SQL 表 ， 可 被 ORM 用 了 


11.6.1 设计 ORM 友好 的 类 
当 使 | 
层次 的 含义 。 
@ 类 可 以 是 一 个 Python 类 ， 
类 也 可 以 用 
和 维护 。 
@ 



























































提供 





2b 本 -| 








以 下 是 一 个 可 














El 





from sqlalchemy.ext.declara 
from sqlalchemy import Column, 





了 元 类 。 对 于 元 数据 而 言 它 是 我 
用 的 导入 列表 。 


tive import declarative _ base 





的 SQL 语句 蔡 换 为 Python : 
语言 即 Python 来 编写 应 | 


-without-cextens 


ions 来 简化 安装 过 程 。 

















的 第 1 级 构造 函数 ， 这 会 带 来 显 




















一 来 ， 还 会 大 幅度 









































它 只 是 将 SQL : 





程序 ， 尽 管 第 2 种 语言 (SQL) 被 使 用 
降低 开发 和 调试 的 复杂 度 。 
E 解 SQL 数据 库 中 的 约束 ， 在 设计 时 依然 需要 考虑 到 这 些 约 











的 实现 移 到 了 Python 中 。 



































于 创建 Python 对 象 。 方 法 函数 由 这 些 对 象 来 使 用 。 
创建 SQL DDL 语句 ， 完 成 数据 库 结 构 的 新 建 



































Tabl 


from sqlalchemy import BigInteger, 


Float, 


Integer, Interval, 
Text, Time, 


SmallInteger, String, 


from sqlalchemy.orm import relationship, 








e 
Boolean, 


Unicode, Unicode] 
backref 


实现 持久 化 类 。 


Date, DateTime, 


类 定义 将 会 包括 3 种 不 同 





























类 也 定义 了 SQL 表 和 Python 类 之 间 的 映射 。 它 将 完成 将 Python 操作 转换 为 SQL DML 并 
基于 SQL 查询 创建 Python 对 象 。 
大 多 数 ORM 的 设计 使 得 我 们 需要 使 
定义 放 在 _init _() 方 法 中 。 有 关 修 饰 符 的 更 多 信息 ， 
SQLAlchemy 需要 创建 一 个 定义 性 的 基 类 (declarative base class) 
门 为 数据 库 所 定义 的 库 。 默 认 地 ， 很 容易 将 这 个 类 称 为 














修饰 符 来 正式 地 定义 类 中 的 属性 。 我 们 不 会 简单 地 将 属性 的 
可 以 看 第 3 章 “ 











属性 访问 、 特 性 和 修饰 符 ” 
。 这 个 基 类 为 应 用 的 类 定义 











Base。 





Enum, \ 


LargeBinary, Numeric, PickleType, \ 


[ext ForeignKey 























我 们 导入 了 一 些 基 本 的 定义 ， 用 二 
Python 类 和 表 之 间 的 映射 。 我 们 导入 了 所 有 通用 的 列 类 型 的 上 
型 ， 它 还 定义 了 SQL 标准 类 型 ， 而 且 还 为 不 同类 型 
在 SQLAlchemy 中 完成 泛 型 、 标 准 和 供应 商 类 型 的 转换 不 算 很 复杂 。 





SQLAchemy 不 但 定义 了 这 些 泛 
一 些 特殊 类 型 。 坚 持 使 用 泛 型 3 
































创建 对 























定义 ， 























的 列 以 及 创建 一 些 表 ， 


站 本 


没有 指定 用 于 完成 
到 其 中 的 一 些 。 
SQL 供应 商定 义 了 









































实际 

















的 











我 们 还 导入 了 两 个 helper 来 定义 表 之 间 的 关系 : relationship 和 backref。SQLAlchemy 的 


元 类 由 dqeclarative _ base() 函数 来 创建 。 





Base = decl 





arative _ base() 





所 创建 的 Base 对 象 必须 是 将 要 定义 的 持久 化 类 的 元 类 。 我 们 会 定义 3 个 表 ， 它 们 会 映射 为 
Python 类 。 我 们 也 会 定义 第 4 张 表 ， 被 SQL 用 来 实现 多 对 多 的 关系 。 
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以 下 是 Blog 类 。 


class Blog (Base): 
_ tablename = "BLOG" 
id = Column (Integer, primary key=True) 





title = Column (String) 
def as dict( self ) : 
return dict( 
title= self.title, 
underline= '='*]len(self.title), 
entries= [ e.as dict() for e in self.entries | 


) 


Blog 类 被 映射 为 了 一 张 名 称 为 “BLOG” 的 表 。 在 这 张 表 中 ， 为 两 个 列 加 了 修饰 符 。iq 列 被 
定义 为 一 个 Integer 主键 。 它 是 自 增 的 ， 因 此 代理 主键 就 会 自动 生成 。 
标题 列 被 定义 为 一 个 泛 型 字符 串 ， 有 关 这 种 类 型 ， 我 们 用 过 Text 、Unicode ， 甚 至 
UnicodqeText 。 对 于 不 同 的 类 型 ， 底 层 引 擎 可 能 提供 了 不 同 的 实现 。 对 SQLite 而 言 ， 这 些 几 乎 是 
相同 的 。 并 且 可 以 注意 到 ，SQLite 不 需要 对 一 个 列 加 最 大 长 度 限制 ， 其 他 数据 库 引 擎 可 能 会 需要 为 
String 的 长 度 提供 上 限 。 
as_dict () 引用 了 一 个 entries 集合 ， 它 并 没有 在 类 中 定义 。 观 察 一 下 Post 类 的 定义 ， 可 
以 看 到 entries 属性 是 如 何 创 建 的 ， 以 下 是 Post 类 的 定义 。 
class Post (Base): 
_ tablename = "POST" 
id = Column (Integer, primary key=True) 


title = Column (String) 
date = Column (DateTime) 























1 


































































































rst text = Column (UnicodeText) 
blog id = Column (Integer, ForeignKey ('BLOG.id')) 
blog = relationship( 'Blog', backref='entries' ) 
tags = relationship('Tag', secondary=assoc post tag, 
backref='posts') 
def as dict( self ) : 
return dict( 
title= self.title, 
underline= '—'*len(self.title), 
date= self.date, 
rst text= self.rst text, 
tags= [ t.phrase for t in self.tags], 
) 


这 个 类 有 5 个 属性 、 两 个 关系 和 一 个 方法 函数 。ia 属性 是 一 个 整 型 的 主键 ， 默 认 情 况 下 ， 它 
将 是 一 个 自 增 的 值 。tit1le 属性 是 一 个 简单 的 字符 串 。qate 属性 是 一 个 DateTime 列 。rst_text 被 
定义 为 UnicodeText， 用 于 强调 我 们 期 望 这 个 字段 中 的 任何 字符 都 是 Unicode 的 。 

blog_id 是 一 个 外 键 ， 引 用 包含 了 这 篇 文章 的 父 blog。 而 且 ， 对 于 外 键 列 的 定义 ， 在 文章 和 
父 博客 之 间 也 定义 了 一 个 显 式 relationship。 这 个 relationship 的 定义 将 作为 一 个 属性 ， 用 
于 完成 从 文章 到 父 博客 的 导航 。 
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在 packref 选项 中 包含 了 向 后 引用 ， 将 被 加 入 Blog 类 中 。 这 个 引用 在 Blog 类 中 将 作为 
文章 集合 ， 包 含 在 Blog 中 。backref 选项 命名 了 Blog 类 中 的 新 属性 ， 用 来 引用 子 Post。 
tag 属性 使 用 了 一 个 relationship 的 定义 ， 这 个 属性 将 通过 一 个 关联 的 表 来 完成 此 操作 : 
查找 和 文章 相关 的 所 有 Tag 实例 。 我 们 会 看 一 下 其 他 相关 的 表 ， 在 这 里 也 使 用 了 backref 来 将 一 
个 属性 包含 在 Tag 类 中 ， 它 将 引用 相关 Post 实例 的 集合 。 
as_dict () 方 法 使 用 了 tags 属性 来 查找 与 指定 Post 有 关 的 所 有 Tag。 以 下 是 Tag 类 的 定义 。 
class Tag (Base): 
_ tablename = "TAG" 
id = Column (Integer, primary key=True) 
phrase = Column (String, unique=True) 
我 们 定义 了 一 个 主键 和 一 个 string 属性 。 我 们 使 用 了 一 种 约束 来 确保 每 个 标签 是 显 式 唯 一 的 ， 
如 果 试 图 向 数据 库 中 插入 重复 记录 则 会 引发 异常 。 在 Post 类 定义 中 的 关系 ， 表 明 在 这 个 类 中 会 有 
额外 的 属性 被 创建 。 
为 了 SQL 中 的 实现 需要 ， 需 要 定义 一 个 关联 表 来 解决 标签 和 文章 之 间 的 多 对 多 关系 。 这 个 表 
只 是 在 SQL 中 技术 上 的 需要 ， 因 此 不 必 添 加 Python 类 的 映射 。 
assoc post tag = Table('ASSOC POST TAG', Base.metadata, 
Column ('POST ID', Integer, ForeignKey('POST.id') )， 
Column ('TAG ID', Integer, ForeignKey ('TAG.id') ) 
) 
我 们 必须 显 式 地 将 它 绑 定 在 Base .metadata 集合 上 。 使 用 了 Base 作为 元 类 的 类 ， 将 自动 
J 含 这 个 绑 定 。 我 们 定义 了 一 个 表 ， 包 含 两 个 Column 实例 。 每 一 列 都 是 一 个 连接 到 其 他 表 的 外 键 
11.6.2 ”使 用 ORM 层 创 建 模型 
为 了 连接 到 数据 库 ， 需 要 创建 一 个 引擎。 引擎 的 一 种 使 用 方式 是 创建 数据 库 实例 ， 其 中 包含 了 表 的 
定义 。 男 一 种 使 用 场景 是 管理 会 话 中 的 数据 ， 接 下 来 我 们 会 介绍 。 以 下 是 一 个 用 于 创建 数据 库 的 脚本 。 


from sqlalc 























hemy import create engine 
('sqlite:///./p2 cl1ll blog2.db', echo=T 








ngine = cr 
Base.metada 
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提供 


创建 一 个 瑟 
所 有 需要 的 额 多 


ate 


Et 


ngine 实 














库 产品 而 言 ， 可 能 还 会 包含 3 




















有 表 的 创 
以 选择 他 





























除 并 重新 他 








建 或 移 除 整个 数 
如 果 在 软件 开发 
| 建 那 张 表 。 对 于 一 些 必 


可 能 还 会 执行 一 个 drop_all ()， 
居 库 模型 。 
期 间 修 改 了 表 定 义 ， 在 SQL 中 表 的 修改 并 不 会 自动 完成 。 我 们 需要 显 式 地 移 











ngin 
ta.create al 
列 时 ， 我 们 
参数 来 创建 数据 库 连 接 。 对 SQLite 而 言 ， 连 接 
主机 名 夭 


1 (engine) 


使 用 了 一 种 类 似 URL 的 
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定义 了 供应 商 产品 # 



































[认证 信息 。 











用 于 删除 所 有 的 表 ， 
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l=} 
大 


a 了 引擎 ， 就 完成 了 一 些 基 本 的 元 数据 操作 。 我 们 实现 了 create all () 














一 个 文件 名 。 对 于 其 他 数据 














， 其 中 包括 了 所 





会 移 除 所 有 数据 。 当 然 ， 也 可 


多， 我 们 希望 保存 一 些 初始 化 数据 ， 将 | 














表 数 据 向 新 表 中 添加 时 
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会 更 复杂 一 些 。 
echo=True 选项 意味 着 ， 生 成 的 SQL 语句 会 写 入 日 志 记录 。 当 为 了 确认 定义 是 否 已 完成 ， 是 
否 创建 了 正确 的 数据 库 模 型 ， 这 个 是 有 用 的 。 以 下 是 生成 的 一 段 输出 结果 。 
CREATE TABLE "BLOG" ( 
id INTEGER NOT NULL, 
title VARCHAR, 


PRIMARY KEY (id) 
) 






















































































CREATE TABLE "TAG" ( 
id INTEGER NOT NULL, 
phrase VARCHAR, 
PRIMARY KEY (id), 
UNIQUE (phrase) 











) 





CREATE TABLE "POST" ( 
id INTEGER NOT NULL, 
title VARCHAR, 
date DATETIME, 
rst text TEXT, 
blog id INTEGER, 
PRIMARY KEY (id), 
FOREIGN KEY (blog id) REFERENCES "BLOG" (id) 





























CREATE TABLE "ASSOC POST TAG" ( 
"POST ID" INTEGER, 
"TAG ID" INTEGER, 
FOREIGN KEY ("POST ID") REFERENCES "POST" (id), 
FOREIGN KEY ("TAG ID") REFERENCES "TAG" (id) 










































































) 
以 上 输出 表明 ， 数 据 库 基于 类 而 定义 ， 使 用 CREATE TABLE 语句 创建 了 相关 的 表 。 


旦 完成 了 数据 库 的 创建 ， 我 们 就 可 以 对 对 象 进 行 创建 、 获 取 、 修 改 和 删除 操作 。 为 了 与 数据 
库 对 象 一 起 工作 ， 需 要 创建 一 个 会 话 ， 作 为 ORM 托管 对 象 的 缓存 。 


11.6.3 使 用 ORM 层 操作 对 象 


为 了 与 对 象 协同 工作 ， 需 要 一 个 会 话 缓存 ， 这 是 绑 定 在 引擎 上 的 。 我 们 有 时 会 向 会 话 缓存 中 添 
加 新 对 象 ， 有 时 也 会 使 用 会 话 缓存 查询 数据 库 中 的 对 象 。 这 可 以 确保 所 有 需要 持久 化 的 对 象 都 已 经 
放 入 了 缓存 。 如 下 代码 演示 了 创建 会 话 的 一 种 方式 。 


from sqlalchemy.orm import SessionmakeL 
























































































































































Session= sessionmaker (bind=engine) 
session= Session() 

















我 们 需要 SQLAlchemy 中 的 sessionmaker () 函数 来 创建 一 个 Session 类 。 它 是 绑 定 在 之 前 
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所 创建 的 数据 库 引 擎 中 的 。 然 后 使 用 了 session 类 来 创建 session 对 象 ， 我 们 使 用 它 来 执行 数 
据 操 作 。 一 般 情 况 下 ， 会 话 是 必需 的 。 
通常 ， 创 建 sessionmaker 类 时 ， 其 中 会 包含 引擎 。 然 后 就 可 以 使 用 sessionmaker 类 来 
为 应 用 创建 多 个 会 话 。 


对 于 简单 对 象 来 说 ， 会 使 用 如 下 代码 来 创建 并 将 它 加 载 到 会 话 中 。 


blog= Blog( title="Travel 2013" ) 
session.add( blog ) 





























































































































以 上 代码 将 一 个 新 的 Blog 对 象 添加 到 名 为 session 的 会 话 中 。Blog 对 象 不 必 写 入 数据 库 。 
我 们 需要 在 数据 库 写 操作 执行 前 提交 会 话 。 为 了 确保 操作 的 原子 性 ， 会 在 完成 创建 一 篇 文章 的 
创建 后 才 提交 会 话 。 


首先 ， 会 查找 数据 库 中 的 Tag 实例 。 如 果 它 们 不 存在 则 新 建 。 如 果 它 们 存在 ， 将 直接 使 用 。 











































































































tags = [ ] 
for phrase in "#RedRanger", "“#Whitby42", "#ICW": 
ty 
tag= session.query (Tag) .filter (Tag.phrase == phrase) .one () 


except sqlalchemy.orm.exc.NoResultFound: 
tag= Tag (phrase=phrase) 
session.add (tag) 

tags.append (tag) 











我 们 使 用 session .query () 函数 来 检查 指定 类 中 的 实例 。 每 个 filter () 函数 会 添加 一 个 关 
键 字 到 查询 中 。one () 函数 用 来 确保 已 经 找到 了 一 行 记录 。 如 果 有 异常 抛 出 ， 那 么 则 意味 着 Tag 不 存 
在 ， 需 要 创建 新 的 Tag 然后 添加 到 会 话 中 。 


一 旦 找到 或 创建 了 Tag 实例 ， 就 可 以 将 它 添加 到 名 为 tags 的 列表 中 ， 并 将 用 这 个 Tag 实例 的 列 
表 来 创建 Post 对象。 以 下 代码 演示 了 如 何 创建 一 个 Post。 
p2= Post ( date=datetime.datetime (2013,11,14,17,25), 
title="Hard Aground", 
rst text="""Some embarrassing revelation. Including @ and by """, 
blog=blog, 
tags=tags 
) 
session.add (p2) 
blog.posts= [ p2 ] 


它 包含 了 一 个 到 父 博客 的 引用 ， 同 时 也 包括 了 新 建 ( 或 找到 的 ) 的 Tag 实例 的 列表 。 
在 类 定义 中 ，Post .blog 属性 被 定义 为 一 个 关系 。 当 为 一 个 对 象 赋值 时 ，SQLAlchemy 会 使 用 
外 的 ID 值 来 创建 外 键 的 引用 ，SQL 数据 库 用 来 完成 关系 的 连接 。 
Post .tags 属性 也 被 定义 为 关系 。Tag 由 相关 表 被 引用 。SQLAIlchemy 会 追踪 ID 值 的 变化 ， 
然后 在 SQL 关系 表 中 为 我 们 创建 必要 的 行 。 
为 了 将 Post 与 Blog 关联 起 来 ， 将 使 用 Blog .posts 属性 。 同 样 地 ， 在 这 里 也 被 定义 成 了 关系 。 
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当 将 Post 对 象 列表 赋值 在 这 个 关系 


session. 


数据 库 的 














使 


j 这 个 会 话 的 实例 ， 这 个 对 象 池 


























commit () 


插入 操作 都 由 自动 生 























Wr 





另外 ， 如 果 要 完全 确保 在 要 提交 


属性 上 时 ，ORM 会 为 每 个 Post 对 象 创建 正确 的 外 键 引用 。 这 样 
做 是 有 效 的 ， 因 为 在 定义 关系 时 ， 提 供 了 backref 属性 。 最 后 ， 通 过 如 下 代码 提交 这 个 会 话 。 


象 
























































成 的 SQL 来 完成 。 对 象 保留 在 会 话 缓存 中 。 如 果 应 用 继 
仍 是 可 用 的 ， 而 不 必 对 数据 库 做 任何 实际 的 查询 。 
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的 查询 语句 中 包含 了 所 有 的 并 发 更 新 的 写 操作 ， 可 以 为 那个 查询 























创建 一 个 新 的 空 会 话 。 当 丢弃 一 个 会 话 并 使 用 空 会 话 时 ， 必 须 从 数据 库 中 重新 取出 对 象 来 刷新 会 话 。 


可 以 写 一 个 简单 的 查询 来 检查 # 


session= 


















































Session() 


打印 出 所 有 的 Blog 对 象 。 














for blog in session.query (Blog): 
t( "{title}\n{underline}\n".format (**blog.as dict()) ) 


prin 


for 


p in blog.entries: 
print( p.as qict () 


) 





以 上 代码 将 获取 所 有 的 Blog 实例 。Blog .as_dict () 方 法 将 获取 一 个 博客 内 的 所 有 文章 。 


Post .as_dict () 将 获取 所 有 的 标签 。SQLAIchemy 会 自动 生成 SQL 查询 并 执行 。 















































我 们 并 没有 包含 其 他 格式 ， 它 们 基于 在 第 9 章 “ 序 列 化 和 保存 一 一 JSON、YAML、Pickle、CSV 和 




















XML” 中 的 模 





象 ， 而 无 需 编写 相关 的 SQL 查询 。 
































板 ， 这 点 并 没有 变化 。 我 们 可 以 从 Blog 对 象 通过 entries 列表 导航 到 Post 对 













































































各 导航 转换 为 查询 时 SQLAlchemy 的 职责 。 对 于 如 何 通 过 生成 
查询 来 刷新 缓存 并 返回 所 期 望 的 对 象 ， 使 用 一 个 Python 迭代 器 就 足够 了 。 














如 果 在 Engine 实例 中 有 定义 echo=True, 那么 我 们 就 可 以 看 到 一 组 SQL 查询 的 执行 , 它们 
会 获取 BlogPost 和 Tag 实例 。 这 些 信息 可 以 让 我 们 了 解 应 用 对 数据 库 服务 器 造成 的 工作 负载 。 


11.7 通过 指定 标签 字符 串 查询 文章 对 象 


在 关系 数据 库 中 有 一 个 很 重要 的 优势 是 可 以 得 到 对 象 之 间 的 关系 。 使 用 SQLAlchemy 的 查询 





能 力 ， 可 以 得 








查询 是 会 话 的 一 个 功能 。 








到 Tag 与 Post 之 间 





























的 关系 ， 并 查询 出 所 有 使 用 同样 Tag 字符 串 的 Post。 

















间 。 没 有 包含 在 会 话 ! 














为 了 得 到 






































这 意味 着 已 经 在 会 话 中 的 对 象 不 需要 从 数据 库 中 再 次 取出 ， 从 而 节约 了 时 
的 对 象 会 被 缓存 在 会 话 中 ， 这 样 一 来 ， 在 提交 时 所 有 的 修改 或 删除 操作 才 触 发 。 





























所 有 包含 了 指定 标签 的 文章 ， 我 们 需要 使 用 关联 表 和 Post 还 有 Tag 表 。 我 们 需要 

















使 用 会 话 中 的 查询 方法 来 指定 期 望 得 





























到 哪 种 类 型 的 对 象 。 我 们 将 使 用 流畅 接口 来 关联 不 同 的 关联 表 















































以 及 最 终 的 表 ， 其 中 包含 了 查询 的 列 名 ， 代 码 如 下 所 示 。 
for post in session.query (Post).joinl(assoc post tag) .join(Tag) .filter( 
Tag.phrase == "#Whitby42" ): 
print( post.blog.title, post.date, post.title, [t.phrase for t in 


post.tag 


S] ) 























session.query() 方 法 指定 我 们 想 要 的 表 。 如 果 像 如 上 代码 那样 来 使 用 ， 我 们 将 得 到 每 一 行 





































































































11.8 通过 创建 索引 提高 性 能 259 
记录 。join () 方法 标识 了 更 多 需要 匹配 的 于 在 类 定义 中 提供 了 关系 信息 ， 因 此 SQLAlchemy 
能 够 通过 使 用 主键 和 外 键 完成 行 的 匹配 进而 创建 出 详细 的 SQL。 最 终 的 filter () 方法 为 要 得 到 

















的 行 的 子 集 提 供 了 列 名 。 如 下 是 生成 的 SQL 代码 。 





SELECT 


"POST" 


m 


id AS "POST blog id" 


























Le AS POST id"y 
date AS "POST date", 


POST” 


"POST".title AS "POST title", 
.rst text AS "POST rst text", 


VPROSTT 
"POST".blog_ 




























































































































































































FROM "POST" JOIN "ASSOC POST TAG" ON "POST".id = "ASSOC POST _ 

TAG"."POST ID" 

JOIN "TAG" ON "TAG".id = "ASSOC POST TAG"."TAG ID" 

WHERE "TAG".phrase = ? 

Python 版 本 比较 容易 理解 ， 因 为 忽略 了 键 匹 配 的 部 分 。print () 函数 使 用 post .blog. title 
来 完成 从 Post 实例 到 相关 博客 的 导航 并 显示 title 属性 。 如 果 博 客 在 会 话 缓存 中 ， 那 么 导航 的 
执行 会 非常 快 。 如 果 博 客 没 有 在 会 话 缓 存 中 ， 就 将 从 数据 库 中 获取 。 

相同 的 行为 也 会 应 用 在 [t .phrase for t in post.tags] 上 。 如 果 对 象 在 会 话 缓存 中 则 
会 取出 直接 用 。 在 这 种 情况 下 ， 与 一 篇 文章 相关 的 Tag 集合 的 SQL 查询 可 能 会 如 下 所 示 。 

SELECT “TAG".id AS "TAG id", "TAG".phrase AS "TAG phrase" 

FROM "TAG", "RSSOC POST TAG" 

WHERE ? = "ASSOC POST TAG"."POST ID" 

AND "TAG".id = "ASSOC POST TAG"."TAG ID" 

在 Python 中 ， 只 需 使 用 post .tags 来 进行 导航 。SQLAlchemy 会 为 我 们 生成 SQL 并 执行 。 





11.8 


通过 创建 索引 提高 性 能 




















提高 一 个 关系 数据 库 〈 例 如 SQLite) 的 途径 之 一 是 加 快 连接 操作 的 执行 。 我 们 不 希望 SQLite 


对 整 表 进 行 读 取 来 查询 匹配 的 行 


会 从 表 中 读 取 相 关 的 行 











中 的 一 种 简 
我 们 可 

















单 的 处 


我 们 定义 了 一 个 在 查询 中 会 使 
理 方式 ， 我 作 
以 对 Post 表 做 小 幅 














巨 

















通过 在 一 个 指定 的 列 上 创建 索引 ， 


j 的 列 时 ， 就 应 该 考虑 为 这 个 列 创建 索引 。 











只 














SQLite 会 对 索引 进行 检测 并 





这 也 是 在 SQLAlchemy 











] 具 需 在 类 的 | 

















class Post (Base) : 


_ tablename | 


"POST" 


遇 性 中 添加 注 
度 的 改动 ， 例 如 ， 可 以 使 / 








牢 ijndex=True。 


j 如 下 代码 来 添加 索引 。 




















id = Column (Integer, primary key=True) 
title = Column (String, index=True) 















































date = Column (DateTime, index=True) 
blog id = Column (Integer, ForeignKey ('BLOG.id'), index=True) 
我 们 为 标题 和 日 期 添加 了 索引 ， 当 查询 匹配 项 是 标题 或 日 期 时 ， 这 个 对 文章 的 查询 就 会 加 速 执行 
然而 并 不 能 一 定 保证 在 性 能 上 会 得 到 一 定 提升 。 关 系数 据 库 包含 了 一 系列 因素 。 在 实际 场景 中 ， 对 








是 否 有 索引 的 两 和 





日 

















青 况 下 分 别 做 涡 





中 


豆 

















是 重要 的 。 
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同样 的 ,为 plog_id 添加 索引 ， 可 能 会 加 速 Blog 和 Post 表 中 行 的 连接 操作 。 而 在 数据 库 引 
擎 中 使 用 了 某 种 特殊 算法 ， 导 致 创建 的 索引 并 没有 起 到 效果 也 是 有 可 能 的 。 

索引 会 带 来 存储 和 计算 的 负载 。 如 果 一 个 索引 很 少 使 用 ， 那 么 创建 和 维护 的 代价 就 会 成 为 一 个 问 
题 ， 而 非 一 种 解决 方案 。 另 外 ， 一 些 特殊 的 索引 可 以 对 性 能 带 来 显著 的 提高 。 在 任何 情况 下 ， 我 们 并 没 
有 机 会 来 直接 操作 数据 库 所 使 用 的 算法 ， 我 们 所 能 做 的 就 是 创建 索引 然后 评估 它 对 性 能 带 来 的 影响 。 


模型 演化 
当 使 用 一 种 数据 库 时 ， 必 须 解 决 模型 演化 的 问题 。 对 象 中 包括 动态 的 状态 和 静态 的 类 定义 ， 存 
储 动 态 的 状态 很 方便 。 类 定义 是 持久 化 数据 模式 的 一 部 分 ,我们 也 具备 了 SQL 模型 的 映射 类 和 
SQL 模型 都 是 绝对 静态 的 。 

如 果 改 变 一 个 类 定义 ， 那 么 如 何 从 数据 库 中 取出 对 象 ? 如 果 必 须 改变 数据 库 ， 如 何 对 Python 映 
射 的 实现 进行 改进 使 之 可 以 仍然 有 效 ? 一 个 良好 的 设计 通常 包括 几 种 技术 的 结合 。 

对 方法 函数 和 了 Python 类 中 特性 的 改变 并 不 会 影响 到 SQL 行 的 映射 ， 可 能 只 会 带 来 很 小 的 改动 ， 
因为 数据 库 中 的 表 与 改动 后 的 类 定义 仍 是 兼容 的 。 一 个 新 的 软件 发 布 会 有 一 个 新 的 次 版 本 号 。 

改变 Python 类 中 的 特性 的 同时 并 不 必要 改动 持久 化 的 对 象 状 态 。 在 将 数据 库 中 的 数值 类 型 转换 到 
Python 对 象 的 过 程 中 ，SQL 是 很 灵活 的 。 一 个 ORM 层 可 以 带 来 灵活 性 。 在 一 些 情况 下 ， 可 以 对 一 些 类 
或 数据 库 做 一 些 改 变 ， 这 个 过 程 只 是 对 次 版 本 的 升级 ， 因 为 已 有 的 SQL 模型 仍然 会 与 新 的 类 定义 兼容 。 

















































































































































































































































































































































































































































































































































































































例如 ， 可 以 将 SQL 表 中 的 整 型 改 为 字符 串 ， 由 于 SQL 和 ORM 之 间 的 转换 ， 这 个 操作 不 会 带 来 任何 中 断 。 
对 SQL 表 定 义 的 改变 显然 会 改变 持久 化 对 象 。 当 数据 库 中 已 有 的 行 与 新 的 类 定义 不 再 兼容 时 ， 
意味 着 这 是 一 个 很 大 的 改动 , 这 种 改动 不 该 通过 修改 Python 类 定义 来 完成 。 这 种 改动 应 该 通过 定 
义 一 个 新 的 子 类 ， 然 后 提供 一 个 新 的 工厂 函数 ， 用 于 完成 创建 新 类 或 旧 类 的 实例 。 
当 对 SQL 数据 进行 持久 化 时 ， 模 型 的 改变 可 以 通过 以 下 两 种 方式 中 的 任何 一 种 来 实现 。 






































@ ”对 已 有 的 模型 使 用 SQL 中 的 ALTER 语句 。 对 一 个 SQL 模型 的 一 些 改变 可 以 是 持续 性 的 。 
至 于 哪些 改变 是 允许 的 ， 关 于 这 点 有 很 多 约束 和 限制 。 并 不 是 针对 所 有 情况 都 如 此 ， 对 于 
一 些小 的 改动 而 言 ， 应 该 视 为 异常 情况 。 

@ 创建 新 表 ， 删 除 上 日 表 。 一 般 地 ， 在 SQL 中 对 模型 的 改动 已 经 很 大 了 ， 需 要 基于 旧 表 来 创 

建新 表 ， 这 样 会 对 数据 库 结 构 进行 大 的 改动 。 

SQL 数据 库 模 型 的 改动 通常 需要 执行 一 个 转换 脚本 ， 这 个 脚本 会 使 用 旧 模 型 对 已 有 数据 进行 查 
询 ， 将 它 转换 为 新 数据 ， 并 使 用 新 模型 来 将 新 数据 插入 到 数据 库 中 。 当 然 ， 要 在 应 用 到 用 户 正在 使 
用 的 、 在 线 的 、 可 操作 的 数据 库 之 前 ， 一 定 先 对 备份 数据 库 进行 测试 。 数 据 库 模型 的 改变 一 旦 完成 ， 
旧 的 模型 就 可 以 删除 以 节省 存储 空间 。 
这 种 类 型 的 转换 可 以 在 同一 个 数据 库 中 完成 ， 使 用 不 同 的 表 名 或 不 同 的 模型 名 称 〈 对 于 支持 命 
名 模型 的 数据 库 而 言 )。 如 果 同 时 保留 旧 数 据 和 新 数据 ， 这 样 在 做 软件 升级 时 就 会 灵活 一 些 。 对 于 和希 
望 提 供 24 小 时 x7 天 服务 的 网 站 来 说 ， 这 点 显得 尤其 重要 。 

在 一 些 情 况 下 ， 向 数据 库 中 添加 一 些 只 包含 了 一 些 审计 信息 的 表 是 必要 的 ， 例 如 模型 的 版 本 标 




















































































































































































































































































































































































































识 。 应 ) 
士 
1 1 。 9 总 结 


我 们 从 3 个 方面 来 了 解 SQLite 的 基本 使 用 :直接 访问 、 通 过 
这 个 ORM。 我 们 必须 创建 SQL DDL 语句 ， 可 以 在 应 用 





可 





11.9.1 


库 














以 使 用 

















SQLAlchemy 类 定义 所 创建 






































在 过 程式 设计 中 完成 ， 或 














因此 可 以 支持 多 个 











使 用 

















设计 要 素 和 折 中 方案 


sqlite3 模块 的 优势 之 一 是 允 商 




















使 用 一 个 关系 数据 库 会 强加 很 多 限 和 





@ 
@ 可 以 写 自己 的 
@ 

















j 可 以 在 创建 数据 库 连 接 后 ， 先 对 这 个 表 进 行 查 询 ， 当 检测 到 模型 版 本 错误 时 就 直接 返回 。 


























的 DDL。 至 于 操作 数据 ， 将 使 用 


匀 已 的 访问 层 ， 或 使 用 SQLAlchemy 来 创建 SQL。 


F 我 们 存储 不 同 的 项 。 上 6 



































访问 层 ，| 
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个 访问 层 和 通过 SQLAlchemy 
直接 执行 ， 或 将 其 放 在 一 个 访问 层 ， 
SQL DML 语句 ， 可 以 直接 














》 也 


























行 映射 ， 将 对 象 作 为 SQLite 的 BLOB 列 处 理 。 
来 完成 对 象 和 SQL 中 行 的 适 配 和 转换 。 








11.9.2 映射 的 方法 


混合 使 用 Python 和 SQL 的 问题 在 于 ， 
的 方案 。 关 系数 据 库 是 一 个 很 好 的 平台 ，Python 引入 了 不 必要 的 面向 对 象 功 


人 认为 使 用 SQL 中 GROUP 


本 





























总 会 想 要 使 ) 


可 使 用 一 个 ORM 层 来 完成 行 与 对 象 之 间 的 映射 。 











] 一 种 “全 部 




































































一 种 理想 的 使 用 。 


日 于 使 用 了 一 个 支持 并 发 写 操作 的 数据 
进程 同时 修改 数据 ， 需 要 依靠 SQLite 中 内 部 的 锁 机 制 来 完成 # 
捉 。 我 们 需要 考虑 妇 




















发 的 处 理 。 














[ 何 将 对 象 映射 到 数据 库 表 中 的 行 。 
可 以 直接 使 用 SQL， 只 使 用 SQL 中 所 支持 的 列 类 型 ， 并 最 大 限度 地 不 使 用 
可 以 对 SQLite 进行 扩展 ， 手 动 进 








面向 对 象 的 类 。 



































昌 歌 、 全 部 跳舞 、 全 部 SQL” 
能 会 对 它 造 成 阻碍 。 

全 部 是 SQL， 没 有 对 象 的 设计 方法 有 时 对 于 特定 的 问题 是 合理 的 。 尤 其 
BY 语句 来 将 数据 集合 成 在 一 起 是 SQL : 





是 ， 文 持 这 个 观点 的 

















关于 这 一 点 ，Python 中 的 defaultdict 和 Counter 提供 了 很 高 效 的 实现 。Python 的 实现 版 











非常 高 效 ， 只 是 使 用 








使 用 GROUP 
































对 


简 


SQL 框架 中 有 效 的 功能 需要 被 如 





defaultdict 对 大 量 的 行进 行 查询 以 及 计算 结果 的 归 # 
BY 要 快 得 多 。 
如 果 有 疑问 ， 就 测试 一 下 。SQL 数据 库 
应 该 会 比 Python 快 很 多 倍 时 ,要 得 到 证 据 。 数 据 收集 3 
于 很 快 可 以 完成 的 任务 。 随 着 空间 使 用 的 增加 和 变化 ， 














ny 








化 。 学 习 ORM 的 功 





己 编 写 的 访问 层 通 常 对 了 
象 之 间 的 映射 也 相对 透明 。 不 过 每 次 类 的 改变 或 者 数据 库 方 表 


一 个 完善 的 ORM 可 能 需要 花 一 些 时 间 来 学 习 其 中 





问题 领域 1 






























































的 支持 者 通常 会 给 出 无 关 紧 要 的 观点 。 
] 一 次 性 初始 化 的 方式 ， 即便 对 
SQL 数据 库 和 Python 的 对 比 结果 也 会 改变 。 

言 有 着 很 强 的 特殊 性 。 在 性 能 上 可 能 会 有 优势 ， 并 且 在 行 和 


























不 局 限于 使 ) 
























































台 上 人 





能 会 涉及 最 初 的 工作 以 及 返工 的 教训 。 











在 设 











在 做， 这 需要 好 

















进行 权衡 和 考虑 。 





FE 实际 : 














， 可 能 比 在 数据 库 


当 被 告知 SQL 





























的 改动 会 造成 一 些 麻 烦 ， 这 是 一 个 缺陷 。 
的 功能 ， 而 它 所 带 来 最 大 的 好 处 是 ， 长 期 的 
计 上 的 初次 尝试 会 带 来 原来 在 
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11.9.3” 键 和 键 的 设计 

寻 为 SQL 依赖 于 键 ， 必 须 在 设计 上 考虑 并 为 不 同 的 对 象 进行 键 的 管理 。 需 要 设计 从 对 象 到 

键 的 映射 ， 用 于 标识 对 象 。 一 种 选择 是 查找 一 个 属性 〈 或 属性 的 结合 )， 它 已 经 是 主键 并 不 能 被 

改变 。 另 一 种 方式 是 生成 不 能 被 改变 的 代理 主键 ， 而 其 他 属性 可 以 被 改变 。 
大 部 分 关系 数据 库 可 以 为 我 们 生成 代理 主键 ， 通 常 这 是 最 好 的 做 法 。 对 于 其 他 唯一 属性 或 候选 

键 属 性 ， 可 以 通过 定义 SQL 索引 来 提高 性 能 。 
必须 考虑 到 对 象 间 外 键 的 关系 。 有 常见 的 几 种 设计 方式 : 1 对 多 、 多 对 1、 多 对 多 和 可 选 的 1 对 1。 

我 们 需要 清晰 地 知道 SQL 是 如 何 使 用 键 来 表示 对 象 关系 的 ， 以 及 SQL 查询 是 如 何 构 建 Python 集合 的 。 


11.9.4 应 用 软件 层 


在 使 用 sqlite3 时 ， 为 了 相对 成 熟 的 可 用 性 ， 
的 软件 架构 分 为 如 下 几 个 部 分 。 
@ ”表现 层 ， 这 是 最 上 层 的 用 户 界面 ， 通 常 为 网 站 或 桌面 GUI 程序 。 
@ ”应 用 层 : 这 是 内 部 服务 或 应 用 中 的 控制 器 。 这 部 分 可 称 为 处 理 模型 ， 与 逻辑 数据 模型 是 不 同 的 。 
@ ”业务 逻辑 层 或 问题 领域 模型 层 : 这 里 是 定义 业务 逻辑 或 问题 模型 的 地 方 。 这 有 时 被 称 为 逻 
辑 数据 模型 。 我 们 已 经 看 了 一 个 例子 ， 如 何 使 用 一 个 微 博 和 文章 来 构建 模型 。 
@ ”基础 架构 ， 这 部 分 通常 包括 一 些 层 和 其 他 横 切 方面 ， 例 如 日 志 、 安 全 性 和 网 络 访问 。 
4 ”数据 访问 层 ， 它们 是 访问 数据 对 象 的 协议 或 方法 。 通 常 是 一 个 ORM 层 。 我 们 已 经 介 
绍 了 SQLAlchemy， 还 有 更 多 其 他 的 选择 。 
4 ”持久 化 层 ， 这 里 是 文件 存储 时 所 使 用 的 物理 数据 模型 。sqlite3 模块 实现 了 持久 化 。 
当 使 用 类 似 SQLAlchemy 的 ORM 时 ， 只 需要 在 创建 引擎 时 对 SQLite 引用 就 可 以 了 。 
在 介绍 本 章 的 sqlite3 和 第 10 章 “ 用 Shelve 保存 和 获取 对 象 ” 时 ， 可 以 看 到 熟练 掌握 面向 
对 象 编程 会 涉及 一 些 更 高 层面 上 的 设计 模式 。 我 们 不 能 简单 地 将 类 设计 为 相互 隔离 的 ,但 是 需要 在 
更 高 的 层面 了 解 类 之 间 是 如 何 组 织 的 。 


11.9.5 ”展望 


在 下 一 章 中 ,我 们 会 介绍 如 何 使 用 REST 来 完成 对 象 的 传输 和 共享 。 这 个 设计 模式 会 演示 ， 如 
何 管理 状态 的 表示 方式 以 及 如 何在 进程 间 传输 对 象 状态 。 我 们 将 使 用 一 些 持久 化 模型 来 表示 正在 传 
输 对 象 的 状态 。 

在 第 13 章 “ 配 置 文件 和 持久 化 ”中 ， 将 介绍 配置 文件 ， 也 会 介绍 几 种 用 
表示 层 数据 表示 进行 持久 化 的 方式 。 




















































































































































































































] 必 须 进行 合理 的 分 层 。 通常， 可 以 看 到 分 层 
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空 制 应 用 程序 的 
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我 们 在 第 9 章 “ 序 列 化 和 保存 一 一 JSON、YAML、Pickle、CSV 和 XML” 的 基础 上 再 介绍 
些 序列 化 方法 。 当 我 们 需要 传输 一 个 对 象 时 ， 通 常会 做 某 种 表述 性 状态 传输 (Representational State 
Transfer，REST )。 当 我 们 序列 化 对 象 时 ， 实 际 上 是 在 创建 对 象 状 态 的 表示 ， 这 种 表示 可 以 被 传输 
到 另外 一 个 进程 中 (通常 在 另外 一 个 主机 上 )， 另 外 一 个 进程 可 以 根据 这 个 状态 的 表示 和 一 个 本 地 
定义 的 类 来 创建 原始 对 象 的 对 应 版 本 。 

有 很 多 种 方式 执行 REST 操作 。 其 中 一 个 方面 是 可 以 使 用 的 状态 表示 ; 另外 一 个 方面 是 控制 传 
输 过 程 的 协议 。 我 们 不 会 介绍 这 些 方面 中 所 有 可 能 的 组 合 ， 相 反 地 ， 我 们 只 关注 其 中 两 种 组 合 。 

对 于 互联 网 的 传输 ， 我 们 会 用 HTTP 协议 实现 CRUD 操作 ， 这 通常 被 称 为 REST 服务 器 。 我 
们 也 会 介绍 如 何 实现 RESTful 服务 。 它 会 基于 Python 的 Web 服务 网 关 接 口 (Web Service Gateway 
Interface，WSGI) 的 实现 一 一 wsgiref 包 。 

对 于 本 地 进程 间 的 通信 ， 我 们 会 介绍 multiprocessing 模块 提供 的 本 地 消息 队列 。 这 里 有 
许多 不 错 的 队列 管理 产品 ， 但 是 ， 本 章 我 们 只 关注 标准 库 中 提供 的 实现 。 

这 种 处 理 过 程 是 基于 使 用 JSON 或 者 XML 表示 对 象 。 对 WSGI 而 言 ， 为 了 定义 Web 服务 器 的 

事务 , 我 们 会 添加 HTTP 协议 和 一 组 设计 模式 。 对 于 multiprocessing, 我 们 会 添加 一 个 处 理 池 
(processing pool)。 
当 使 用 REST 传输 时 还 有 一 点 需要 考虑 : 数据 源 可 能 是 不 可 信 的 。 我 们 必须 实现 一 些 安全 机 制 。 当 
数据 以 常见 的 方式 表达 时 ， 例 如 JSON 和 XML， 有 一 些 安全 问题 需要 考虑 。YAML 引进 了 一 种 安全 机 
制 并 且 支 持 安全 负荷 运行 ， 具 体 请 参见 第 9 章 “ 序 列 化 和 保存 一 一 JSON、YAML、Pickle、CSV 和 
XML”。 由 于 这 些 安全 问题 的 存在 ，pick1le 模块 也 提供 了 一 个 带 有 限制 的 序列 化 工具 ， 我 们 可 以 
用 它 来 阻止 导入 可 疑 模 块 和 执行 恶意 代码 。 


12.1 类 、 状 态 和 表示 
在 一 些 情 况 下 ， 我 们 需要 创建 为 远程 客户 端 提供 数据 的 服务 器 。 在 一 些 其 他 情况 下 ， 我 们 可 能 


希望 使 用 来 自 远程 计 算 的 数据 , 也 可 能 会 遇 到 一 种 混合 的 情况 , 就 是 我 们 的 应 用 程序 是 远程 计算 机 的 一 个 
用 户 ， 也 是 移动 应 用 程序 的 服务 器 。 有 许多 的 情况 我 们 的 应 用 程序 会 使 用 保存 的 远程 计算 机 的 对 象 。 
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我 们 需要 一 个 能 将 对 象 在 不 同 进 程 间 传输 的 方法 ， 可 以 将 一 个 大 问题 分 解 为 两 个 更 小 的 问题 。 
不 同 的 网 络 协议 可 以 帮 有 我 们 将 字 节 流 从 一 个 主机 上 的 某 个 进程 传输 到 另 一 台 主 机 的 


列 化 可 以 将 对 象 转换 为 字 节 流 。 

























































































































































































某 个 进程 中 。 序 




























































































与 对 象 状 态 不 同 , 我 们 用 一 种 完全 独立 并 且 简 单 的 方法 传输 类 定义 ， 直接 用 源 代码 来 交换 类 定 
义 。 如 果 我 们 需要 为 远程 主机 提供 某 个 类 的 定义 ， 那 么 我 们 将 Python 源码 发 给 该 主机 。 为 了 让 代 
码 可 以 正常 工作 ， 必 须 正确 地 进行 安装 ， 这 通常 由 管理 员 手 动 完成 。 

网 络 用 于 传输 字 节 流 。 因 此 ， 我 们 必须 用 字 节 流 表示 一 个 对 象 实例 中 变量 的 值 。 通 常用 两 个 步 
又 将 对 象 转换 为 字 节 流 ， 首 先 用 字符 串 表 示 一 个 对 象 的 状态 ,然后 基于 这 个 字符 串 以 茶 种 标准 的 纺 
码 方式 提供 字 节 表示 。 











12.2 用 HTTP 和 REST 传输 对 象 


超 文本 传输 协议 (Hypertext Transfer Protocol，HTTP ) 是 由 一 系列 的 RFC (Request for 


Comments) 文档 定义 的 。 我 们 不 会 介绍 所 有 的 

















日 季 ， 但 是 会 触及 其 ! 




















3 个 高 层 的 部 分 。 


HTTP 协议 包括 请 求 和 响应 。 一 个 请 求 包括 一 个 方法 、 一 个 统一 资源 标识 符 (Uniform Resource 


Identifier，URI)、 一 些 
ET 和 POST 请 求 。 标 # 


GI 





一 个 




















住 的 浏览 器 包括 GET、POST、P 
求 ， 因 为 它们 对 应 着 CRUD 操作 。 我 们 会 忽略 大 部 分 的 报头 而 是 只 关注 URI 的 路 径 部 分 。 
响应 包含 一 个 状态 码 、 











UF 


原因 、 一 些 报头 和 一 些 数据 











报头 和 可 选 的 附件 。 标 准 中 定义 了 许多 可 月 





方法 。 大 多 数 浏览 器 主要 使 用 























和 DEL 





ET 


E 请 求 ， 我 们 会 使 用 这 4 种 请 








。 有 许多 可 能 返回 


= 
PA 




















的 状态 码 ， 


池 


们 





对 它们 其 中 的 几 个 感 兴趣 。200 通常 是 来 自 服务 器 的 OK 响应 。201 代表 created 响应 ， 它 可 能 适合 











在 D 





EL 





ET 








用 来 向 我 们 展示 PoSsT 请 求 成 功 并 且 数 和 
Ep 中 。400 代表 


























状态 码 广泛 地 被 用 来 反映 某 些 操作 无 法 执行 或 者 出 现 错误 。 


大 多 数 2xx 成 功 响应 会 包含 一 个 《或 者 一 些 ) 编码 过 








AS 











的 错误 信息 。 


HTTP 是 无 状态 协议 。 服 务 器 不 会 保留 














已 经 被 发 布 。204 代表 No Content 响应 ， 
Bad Request，401 代表 Unauthorized，404 代表 Not Found。 


的 对 象 ，4xx 错误 响应 可 能 会 包含 更 讨 

















它 可 能 适合 被 用 
这 些 








上 





th 





下 
































限制 。 对 了 











端 不 是 人 ， 每 个 请 求 者 
的 , 会 假设 服务 器 使 


交互 式 网 站 ， 通 过 cookie 来 追踪 寻 
可 以 包含 验证 凭证 
安全 套 接 字 层 (Secure Sockets Layer, SSL), 并 且 使 用 



































连接 而 不 是 基于 庙 





























任何 之 前 与 客户 端 交 互 的 信息 ， 有 很 多 方法 可 以 元 服 这 个 



































步 强 








80 的 HTTP 连接 。 


12.2.1 用 REST 实现 CRUD 操作 


我 们 会 介绍 发 明 REST 协议 的 3 个 基本 想法 。 第 1 个 想法 是 , 使 用 
2 个 想法 是 ， 可 以 用 HTTP 的 URI 请 求 来 命名 一 个 对 象 ， 一 个 URI 包含 任何 级 别 的 
节 ， 它 以 统一 的 格式 包含 了 模式 、 模 块 、 类 和 对 象 标识 符 。 最 后 ， 我 们 可 以 将 HTTP 方法 映射 到 


化 表示 。 








VS 














AAA 
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改善 程序 行为 。 但 是 ， 对 于 网 络 服务 ， 客 户 
调 了 保证 连接 安全 1 





关 








的 重要 性 。 基 于 我 们 的 目 
于 端口 443 的 HTTPS 





























Es 





























任何 方便 对 象 状态 的 文本 序 














CRUD 规则 来 定义 在 命名 对 象 
HTTP 协议 实现 RESTful 服务 是 在 提 























Me 

















求 和 响应 的 语义 可 能 会 有 不 同和 
一 种 单一 的 方法 。 我 们 主要 关 汶 
一 个 REST 服务 器 常常 通过 下 面 5 种 基本 | 
@ 创建 : 我 们 会 用 
恩 。 一 个 类 似 / 
含 最 后 被 保存 对 象 的 备份 。 返 回 





独立 的 身份 管理 


常会 使 用 





















































URI 或 者 是 用 于 创建 URI 的 相关 键 。 
F 获 取 多 个 对 象 的 请 求 。 
F 以 查询 字符 串 的 




















RESTful 资源 的 














GET 请 求 ， 








blog/id/。 尽 管 预期 的 响应 是 
存在 一 个 列表 中 。 


更 新 : 我 们 会 用 


子 ， 我 
删除 ;我们 会 用 


获取 -搜索 (Retrieve-Search )， 用 寺 
包含 一 个 提供 查询 条 件 的 URI， 通 常 条 伯 
的 URI 是 //host/app/blog/?title="Travel 2012-2013"。 注 意 ，GET 不 会 改变 任何 


讶 且 包 含 一 个 在 路 径 ， 


个 























HTTP 的 POST 请 求 创建 一 个 新 的 对 象 ， 而 URI 在 这 种 情况 下 


/host/app/blog/ 的 路 径 可 能 可 以 为 类 命名 。 响 应 可 以 是 201， 并 且 包 


上 即将 执行 的 操作 。 
kt 战 HTTP 请 求 的 
的 讨论 和 意见 。 相 比 于 介绍 各 有 各 自 优 点 的 各 利 
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POST 请 求 应 该 被 用 了 


站 应 的 原始 定义 。 这 意味 着 对 了 


FE Python 语言 , 而 不 是 设计 RESTful 网 络 服务 器 这 个 更 一 般 性 的 问题 。 
] 法 支持 CRUD 操作 。 


h 选 择 ， 我 们 会 建议 用 


































































































创建 








我 们 会 使 用 





HTTP 的 GET 























只 提供 类 信 














的 对 象 信息 可 能 包括 RESTful 服务 器 为 新 创建 对 象 分 配 的 
些 新 的 RESTful 资源 。 








请 求 ， 并 








多 式 包含 在 ? 字符 之 后 。 可 能 














获取 -实例 (Retrieve-Instance): 这 是 用 于 获取 单个 对 象 的 请 求 。 我 们 会 使 用 HTTP 的 
指定 了 特定 对 象 的 URI。 可 能 的 URI 是 //host/app/ 















































HTTP 的 PUT 请 求 , 
//host/app/blog/id/。 响 应 可 以 是 200， 并 
这 个 操作 会 修改 RESTful 资源 。 我 们 可 以 
门 依然 会 使 用 200。 
























































使 ) 











HTTP 的 DELETE 请 求 ， 六 

















URI。 响 应 可 以 是 简单 的 204 NO CONTENT， 而 不 





由 于 HTTP 



























































HTTP 的 Authorization 
须 也 用 SSL 为 Authorization 头 的 内 容 和 
服务 器 提供 验证 令 牌 而 不 是 仅仅 使 用 凭证 。 








协议 是 无 状态 的 ， 因 此 没有 登录 入 























头 提供 
提供 安全 措施 。 





[注销 的 规定 。 
用 户 和 密码 这 些 验 证 信息 。 当 





于 这 个 响应 是 GET， 因 此 不 会 改变 资源 状态 。 
包含 一 个 指定 了 目标 替代 对 象 的 URI。 可 能 的 URI 是 
包含 一 份 更 新 后 对 象 的 备份 。 很 明显 ， 
其 他 号 码 来 代替 200。 但是， 对 于 我 们 的 例 








用 在 响应 ， 
































by = 





























12.2.2 ”实现 非 CRUD 操作 











一 些 应 | 

















些 更 成 熟 的 


程序 中 有 一 些 操 作 无 法 被 简单 地 归 类 为 CRUD。 例 如 ， 我 们 可 能 有 























单独 的 对 象 ， 但 是 为 了 与 搜索 的 响应 兼容 ， 它 有 可 能 被 保 




















F 昌 包含 一 个 类 似 于 / /host/app/ blog/id/ 的 
提供 任何 对 象 的 细节 。 

每 个 请 求 都 必须 单独 验证 。 我 们 通 
选择 这 种 做 法 时 , 我 们 必 















































代 产 品 ， 它 们 会 使 用 




















个 用 于 执行 复杂 


Sp 























计算 的 远程 过 程 调用 (Remote Procedure Call，RPC) 风格 的 应 用 程序 。 计 算 用 的 参数 通过 URI 提 




















供 ， 所 以 没有 改变 RESTful 服务 器 上 资源 的 状态 。 





大 多 数 时 候 ， 这 些 主 要 执行 计算 任务 的 操作 可 以 实现 为 GET 请 求 ， 























使 ) 








j 付 费 服 务 的 网 站 尤其 如 























百 了 王 
电 女 。 





大 








作为 不 可 否认 计划 (non-repudiation scheme) 的 一 部 分 ， 如 果 想 要 记录 请 求 和 响应 日 
需要 考虑 使 用 POST 请 求 。 这 对 了 











为 状态 没有 改变 。 但 是 ， 














志 ， 那 么 可 能 
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12.2.3 ”REST 协议 和 ACID 

第 10 章 “ 用 Shelve 保存 和 获取 对 象 ” 中 定义 了 ACID 属性 。 这 些 属性 是 原子 性 、 一 致 性 、 隔 离 
性 和 持久 性 ， 这 些 是 包含 多 个 数据 库 操 作 事 务 的 基本 属性 ， 这 些 属性 不 会 自动 成 为 REST 协议 的 一 部 
分 。 当 我 们 确保 达到 ACID 属性 的 要 求 时 ， 必 须 考 虑 到 HTTP 是 如 何 工作 的 。 





每 个 HTTP 请 求 都 是 原子 的 ， 所 以 ， 我 们 应 该 避免 


































































































忆 程序 设计 成 将 操作 操作 分 到 多 个 PosT 请 





求 中 。 反 之 ， 我 们 应 该 想 办 法 把 所 有 的 信息 合并 在 一 个 单独 的 请 求 中 。 另 外 ， 我 们 必须 认识 到 请 求 








们 有 一 个 合理 的 多 





























层 架 构 ， 我 们 应 该 将 持久 性 委托 给 独立 的 持久 化 模块 来 完成 。 











常常 来 自 许多 交叉 的 客户 端 ， 也 没有 一 种 简洁 的 方式 可 以 在 交叉 的 请 求 序 列 中 保证 隔离 性 。 如 果 我 

















为 了 达到 ACID 属性 的 要 求 ， 常 用 的 一 个 方法 是 让 POST、PUT 或 者 DELET 


关 的 信息 。 通 过 提供 一 个 生 














请 求 包含 所 有 相 



































独 的 复合 对 象 ， 应 用 程序 可 以 在 单个 REST 请 求 中 执行 所 有 操作 。 这 些 





大 型 的 对 象 成 为 了 文档 〈documents)， 它 们 可 能 包含 多 个 对 象 并 且 作为 更 复杂 事务 的 一 部 分 。 
Post 的 关系 ， 我 们 会 发 现 ， 为 了 创建 一 个 新 的 Blog 实例 ， 我 们 可 能 希望 可 以 























12.2.4 


没有 





回 到 Blog 和 
处 理 两 利 





h HTTP POST 请 求 。 这 两 种 请 求 如 下 。 
































只 有 标题 而 没有 其 他 POST 对 象 的 Blog: 可 以 很 容易 地 为 这 个 对 象 实 现 ACID 属性 ， 因 为 它 





内 是 个 











单独 的 对 象 。 








八 撑 


一 个 包含 


























了 Post 对 象 集合 的 复合 Blog 对 象 : 我 们 需要 序列 化 Blog 和 所 有 相关 的 Post 











实例 。 这 个 对 象 需要 在 一 个 POST 请 求 中 发 送 。 然 后 ， 可 以 通过 创建 Blog 对 象 和 相关 的 Post 















































对 象 ， 并 且 当 所 有 的 对 象 都 保存 后 返回 一 个 201 Created 状态 实现 ACID 属性 。 这 可 


能 需要 在 



































支持 RESTful 服务 器 的 数据 库 中 执行 一 个 复杂 的 多 语句 事务 。 


选择 一 种 表示 方法 一 一 JSON、XML 或 者 YAML 










































































可 以 用 URI 




















有 的 表示 方法 。 
可 以 用 query string 的 一 部 分 : https://host/app/class/id/?form=XML。 
的 一 部 分 : https://host/app;XML/class/id/。 在 这 个 例子 中 ， 我们 





里 由 只 选择 一 种 表示 方法 ， 相 对 来 说 ， 文 持 几 种 不 同 的 表示 方法 也 是 很 容易 的 。 客 户 端 可 以 请 
求 使 用 某 种 特定 的 表示 方法 。 客 户 端 可 以 在 下 面 这 些 地 方 指 定 想 要 使 月 














用 了 分 号 让 程序 能 够 找到 请 求 的 表示 方法 。app; XML 语法 将 程序 命名 为 apP, 指定 格式 


为 XML。 

















可 以 使 / 





这 些 都 是 非常 


用 来 解 书 


JSON 是 很 多 JavaScript 表示 层 的 首选 。 其 他 的 表示 层 或 者 其 他 种 类 的 客户 端 可 能 会 倾向 于 划 





片段 标识 符 ，https://host/app/class/id/#XML。 
@ 可 以 把 它 放 在 HITP 请 求 的 Header 中 。 例 如 ， 可 以 用 Accept Header 指定 表示 方法 。 






































好 的 选择 。 为 了 与 现 有 的 RESTful 服务 兼容 ， 我 们 可 能 需要 











使 | 






































ff URI 模式 的 框架 本 身 可 能 也 会 建议 使 用 茶 种 格式 。 


j 某 种 特定 的 格式 ， 




































































他 的 表示 方法 ， 例 如 XML 或 者 YAML。 在 一 些 例子 中 ， 可 能 还 有 其 他 表示 方法 。 例 如 ， 某 个 特殊 





的 客户 端 应 用 程序 











可 能 要 求 使 用 MXML 或 者 XAML。 
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12.3 实现 一 个 REST 服务 器 一 一 WSG1 和 mod_wsgi 


REST 是 基于 HTTP 建立 的 ，REST 服务 器 是 HTTP 服务 器 的 扩展 。 为 了 稳定 性 、 





通常 会 基于 某 个 服务 器 创建 REST 服务 ， 














Python， 我 们 需要 安装 一 些 扩展 模块 ， 其 ; 








高 性 能 和 安全 性 ， 
侈 如 Apache Httpd 或 者 nginx。 这 个 服务 器 模式 默认 不 支持 
含 与 Python 应 用 程序 交互 接口 。 


ya 








WSGI 是 常用 的 Web 服务 器 和 Python 的 接口 。 更 多 的 信息 可 以 参考 http://www.wsgi.org。 














包括 了 WSGI 引用 
http://www.python 


Python 标准 
见 PEP333: 






































WSGI 的 目的 是 用 一 个 相对 简单 
准 化 。 这 让 我 
列 能 够 应 对 增 量 处 理 请 求 的 应 用 程序 。 


每 个 WSGI 应 用 程序 必须 有 下 


































































































result = application(environ, start response) 








且 容 易 扩 展 的 Python API 来 将 HTTP 的 请 求 响应 处 
门 可 以 将 复杂 的 Python 解决 方案 结构 化 为 相对 独立 的 模块 。 我 们 的 目标 是 建立 一 系 


的 实现 。 关 于 Python3 中 这 个 引用 的 实现 是 如 何 工 作 的 ， 可 以 参 
.org/dev/peps/pep-3333/。 














里 过 程 





标 

















这 就 创建 了 一 种 每 个 环节 都 会 向 请 求 中 添加 信息 的 管道 。 
四 这 个 API。 


environ 变量 是 必须 包含 环境 信息 的 dict。start_response 函数 必须 用 来 为 客户 端 创建 











响应 ， 这 个 函数 用 来 发 送 响应 码 和 报头 。 返 











回 值 必须 是 一 个 可 壕 代 的 











在 WSGI 标准 中 , 术语 应 用 程序 有 











许多 不 同 的 意义 。 


> Ar 吕 


























| 








程序 ， 这 并 不 是 因为 WSGI 有 意 地 推 



































的 意图 是 使 用 更 大 更 复杂 的 Web 框架 。 








所 有 的 Web 六 





外 








子 付 里 ， 














也 就 是 响应 的 了 


FE 体 。 

















或 者 需要 在 与 底层 WSGI 兼容 的 应 用 程序 中 编写 代码 ， 





























单独 的 服务 器 可 能 有 许多 WSGI 应 用 
真正 
E 架 都 会 使 用 WSGI 的 API 定义 来 保证 兼容 性 。 


WSGI 参考 的 实现 不 适合 作为 一 个 公开 的 Web 服务 器 。 这 个 服务 器 没有 直接 支持 SSL， 为 了 用 











正确 
个 和 





















































扩展 模块 ， 或 者 使 用 支持 WSGIAPI 的 Web 





器 转发 给 Python。 这 让 Web 服务 器 得 以 提供 静态 内 容 ， 通 过 WSGI 接 


的 SSL 加 密封 装 套 接 字 ， 我 们 需要 做 一 些 额外 
有 特权 的 用 户 ID 在 setuid 模块 中 运行 进程 。 














的 工作 。 为 了 访问 80 (或 者 443) 端口 ， 


























mr 
个 常 | 






































服务 器 ， 这 意味 






































责 提 供 动态 的 内 容 。 
下 














org/moin/webServers。 这 些 服务 器 (或 者 插件 ) 适合 
一 个 选择 是 创建 一 个 独立 的 Python 服务 器 ， 然 后 | 











男儿 
独立 的 Python 镜像 中 。 当 使 用 


















































首 请 求 会 从 使 ) 











访 















































必须 用 


的 方法 是 在 Web 服务 器 中 安装 WSGI 
标准 WSGI 接 


的 服务 








问 的 Python 应 用 












































j 电 起 
Apache httpd 时 ， 可 以 通过 mod_ws 
这 里 我 们 只 关注 Python， 所 以 不 会 介绍 nginx 和 Apache httpd 的 

















i 





12.3.1 创建 简单 的 REST 应 用 程序 和 服务 器 


我 们 会 编写 一 个 非 

















常 简单 的 REST 服务 器 ，) 
个 简单 请 求 的 例子 。 重 点 将 放 在 Python 中 关于 RESTful Web 服务 器 的 编程 部 分 。 妇 


软件 作为 更 大 型 的 Web 服务 器 插件 ， 例 如 Apache httpd 或 者 nginx， 还 需要 做 一 些 
































0 果 想 要 











他 工作 





程序 负 





四 是 一 些 用 Python 写 的 或 者 支持 Python 插件 的 Web 服务 器 : https://wiki. Python. 
来 提供 稳定 、 安 全 、 公 玫 
EE 定 问 将 请 求 从 公 玫 


F 的 Web 服务 器 。 
F 的 服务 器 上 分 流 到 各 个 
gi 模块 创建 独立 的 Python 镜像 。 由 于 





于 旋转 轮 盘 (Roulette )。 这 是 一 个 服务 响应 一 


把 这 个 


o 
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月 
多 | 








首先 ， 我 们 定义 一 个 简化 的 轮 盘 。 


class Wheel: 
"""Abstract, zero bins omitted."™"" 
def init ( self ): 
self.rng= random.Random() 


[ 





self.bins= 


{str (nn): (35,1)y 
self.redblack (n): (1,1), 
self.hilo(n): (1,1), 
self.evenodd(n): (1,1), 


} for n in range(1,37) 


] 








Qstaticmethod 
def redblack (n) : 
return "Red" if n in (1，3，5，7，9，12，14，16，18， 
19, 21, 23, 25, 27, 30, 32, 34, 36) else "Black" 
Qstaticmethod 
def hilo(n) : 
return "Hin if n >= 19 else "Lo" 
Qstaticmethod 
def evenodd (n): 
return "Even" if n % == 0 else "Odd" 
def spin( self ) : 
return self.rng.choice( self.bins ) 

























































































Wheel 类 包含 了 一 个 箱子 的 列表 。 每 个 箱子 都 是 一 个 dict， 键 代表 的 是 当 球 落 到 箱子 中 时 会 
成 为 赢家 的 注 ， 值 是 赔 率 。 这 里 我 们 只 定义 了 一 个 很 短 的 下 注 列 表 ， 完 整 的 轮 盘 下 注 列表 非常 庞大 。 
我 们 也 会 忽略 零 或 者 双 零 的 箱子 。 有 两 种 常用 的 轮 盘 ， 这 里 是 定义 了 常用 轮 盘 的 两 个 mixin 类 。 
class Zero: 
def jinit ( self ): 
super(). init  () 
self.bins += [ {'0': (35,1)} |] 
class DoubleZero: 
def jinit ( self ): 
super(). init  () 
self.bins += [ {'00': (35,1)} ] 
Zero mixin 类 将 bins 初始 化 为 单 零 。DoublezZero mixin 类 将 bins 初始 化 为 双 零 。 这 些 是 相对 



























































































































































简单 的 箱子 ， 只 有 定 了 这 个 号 码 本 身 才能 赢得 这 些 箱子 的 投注 。 

这 里 我 们 使 用 mixin 是 因为 会 在 后 面 的 一 些 例子 中 优化 whee1。 通 过 使 用 mixin， 就 可 以 确保 每 
个 对 于 基 类 wheel 的 扩展 都 能 够 以 一 致 的 方式 进行 工作 。 关 于 更 多 mixin 风格 的 设计 内 容 ， 请 参 
见 第 8 章 “ 装 饰 器 和 mixin 一 一 横 切 方面 ”。 

下 面 是 定义 了 两 种 常用 轮 盘 的 子 类 。 
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class American( Zero, DoubleZero, Wheel ) : 


pass 





class European( Zero, Wheel ) : 


pass 








这 两 个 类 用 mixin 扩展 了 基本 的 Wheel 类 ,它们 会 为 不 同 轮 盘 选择 不 同 的 初始 化 箱子 的 方式 ， 
这 些 Wheel 的 子 类 可 以 像 下 面 这 样 使 用 。 




















american = American() 
european = European () 
print( "SPIN", american.spin() ) 


每 次 执行 spin () 都 会 产生 一 个 类 似 下 面 这 样 的 简单 全 
{'E 


















































So 





ven Cly Ly DO (Ly Ly SRed re (5 



































dict 中 的 键 是 投注 的 名 称 ， 值 是 包含 两 个 元 素 、 用 于 表示 赔 率 的 元 组 。 上 面 例子 中 Red 12 是 


赢家 ， 它 既是 最 小 的 也 是 偶数 。 如 果 我 们 在 12 上 下 注 ， 因 为 赔 率 是 35 比 1， 所 以 会 赢得 35 倍 于 投 沪 


的 回报 。 















































mT 














其 他 投注 的 赔 率 是 1 比 1， 我 们 会 赢得 和 投注 一 样 的 回报 。 


Tr 















































我 们 定义 了 一 个 简单 路 径 来 决定 使 用 哪 种 轮 盘 的 WSGI 应 用 程序 。 一 个 类 似 于 nttp:// 


























localhost :8080/european/ 的 URI 会 使 用 欧式 轮 盘 。 另 外 一 种 路 径 会 使 用 美式 轮 盘 。 














这 是 





有 是 用 了 wheel 实例 的 WSGI 程序 。 





import sys 


import wsgiref.util 


import json 


def wheel (environ, start response): 


request= wsgiref.util.shift path infol(environ) # 1. Parse. 

print( "wheel", request, file=sys.stderr ) # 2. Logging. 

if request.lower() .startswith('eu'): # 3. Evaluate. 
winner= european.spin() 





else: 
winner= american.spin() 
status = '200 OK' # 4. Respond. 
headers = [('Content-type', ‘application/json; charset=utf-8')] 
start response (status, headers) 
return [ json.dumps (winner) .encode ('UTF-8') ] 


























这 是 


的 值 。 这 
返回 None。 




















有 展示 了 WSGI 应 用 程序 中 一 些 基本 的 组 成 部 分 。 
首先 ， 我 们 用 了 wsgiref.util.shift path info() 函数 扫描 environ['PATH INFO'] 
会 对 请 求 中 的 路 径 信息 的 一 个 层次 进行 解析 ， 它 会 返回 找到 的 值 ， 当 没有 提供 路 径 时 ， 它 会 


















































其 次 ， 写 日 志 的 那 行 代码 说 明 如 果 我 们 想 记 录 日 志 则 必须 将 信息 写 到 sys .stqerr 中 。 任 







































































何 写 到 sys . stdqout 的 信息 都 会 作为 WSGI 应 用 程序 响应 的 一 部 分 。 在 调用 start response () 





























之 前 ， 任 何 打 印信 息 的 尝试 都 会 导致 异常 ， 





Bs 








为 状态 码 和 报头 都 还 没有 发 送 。 
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再 次 ， 我 们 根据 请 求 计算 出 响应 。 这 里 使 用 了 两 个 全 局 变量 european 和 american 来 提 
供 行为 一 致 的 随机 响应 序列 。 如 果 尝 试 为 每 个 请 求 创 建 一 个 唯一 的 Wheel 实例， 那么 就 表明 我 们 没 
有 以 正确 的 方式 使 用 随机 数 生成 器 。 

最 后 ， 我 们 用 合适 的 状态 和 HTTP 报头 组 成 一 个 响应 。 响 应 的 主体 是 一 个 JSON 文档 ， 根 据 
HTTP 的 要 求 ， 我 们 已 经 用 UTF-8 将 这 个 文档 编码 为 一 个 符合 要 求 的 字 节 流 。 

现在 可 以 启动 这 个 服务 器 的 演示 版 本 ， 这 个 版 本 只 有 一 个 函数 ， 如 下 所 示 。 

























































































from wsgiref.simple server import make server 
def roulette server (count=1): 
httpd = make server('', 8080, wheel) 
if count is None: 
httpd.serve forever() 
else: 
for c in range (count): 
httpd.handle request () 


wsgiref.simple server.make server() 函数 创建 了 服务 器 对 象 。 这 个 对 象 会 调用 
可 回调 的 wheel () 处 理 每 个 请 求 。 我 们 用 了 本 地 的 主机 名 '' 和 一 个 非特 权 端 口 一 一 8080。 使 
用 特权 端口 80 需要 setuid 特权 ， 而 且 最 好 让 Apache httpd 服务 器 处 理 这 个 过 程 
旦 服务 器 建立 ， 它 就 会 使 用 自动 持续 运行 , 这 是 因为 使 用 了 httpd.serve forever () 方 法 。 
是 ， 对 于 单元 测试 ， 通 常 更 好 的 方法 是 处 理 一 定数 量 的 请 求 ， 然 后 停止 服务 器 。 
我 们 可 以 在 终端 窗口 的 命令 行 中 运行 这 个 函数 。 一 旦 运行 这 个 函数 ， 就 可 以 用 浏览 器 查看 当 我 们 
请 求 http://localhost :8080/ 时 的 响应 。 当 创建 某 个 技术 原型 或 者 调试 时 ， 这 种 方法 非常 有 用 


12.3.2 ”实现 REST 客户 端 


在 介绍 更 智能 的 REST 服务 器 应 用 程序 之 前 ， 我们 会 先 介绍 如 何 编写 REST 客户 端 。 下面 的 函 
数 会 用 GET 方式 向 某 个 REST 服务 器 发 送 一 个 简单 的 请 求 。 
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import http.client 
import json 
def json get (path="/"): 
rest= http.client.HTTPConnection('localhost', 8080) 
rest.request ("GET", path) 
response= rest .getresponse() 
print( response.status, response.reason ) 
print( response.getheaders() ) 
raw= response.read() .decode ("utf-8") 
if response.status == 200: 
document= json.loads (raw) 
print ( document ) 
Se 
print( raw ) 
































这 里 展示 了 RESTful API 的 基本 使 用 方法 。http .client 模块 包含 4 个 步骤 的 。 
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@ 用 HTTPConnection () 建 立 连接 。 

@ 用 命令 和 路 径 发 送 请求 。 

@ 获取 响应 。 

@ 读 取 响应 中 的 数据 。 

请 求 可 以 包括 一 个 附加 的 文档 (POST 需要 使 用 ) 和 额外 的 报头 。 在 这 个 函数 中 ， 我 们 打印 了 





























响应 ! 























的 某 些 部 分 。 在 本 例 中 ， 我 们 读 取 了 状态 码 和 表示 原因 的 文本 。 大 多 数 时 候 ， 我 们 会 期 望 得 

















到 状态 200 和 ok 作为 原因 文本 ， 同 时 也 读 取 和 打印 了 所 有 的 报头 。 
最 后 ， 我 们 将 整个 响应 读 到 一 个 临时 的 字符 串 raw 中 。 如 果 状 态 码 是 200， 用 json 模块 从 响应 字 
























































加 载 对 象 ， 这 个 步骤 可 以 恢复 从 服务 器 发 送 的 、 用 JSON 编码 过 的 序列 化 对 象 。 





















































0 果 状 态 码 不 是 200, 我 们 只 打印 可 用 的 文本 。 它 有 可 能 是 一 条 错误 信息 或 者 其 他 可 用 于 调试 的 


























12.3.3 ”演示 RESTful 服务 并 创建 单元 测试 
演示 RESTful 服务 器 相对 简单 。 我 们 可 以 导入 服务 器 类 和 函数 定义 ， 然 后 从 终端 窗口 启动 服务 


器 函数 。 然 后 ， 我 们 可 以 访问 http://Localhost:8080 查看 响应 信息 。 



































为 了 能 够 正确 地 完成 单元 测试 ,我 们 希望 客户 端 和 服务 器 之 间 的 信息 交换 方式 更 为 统一 。 对 于 
一 个 可 控 的 单元 测试 ， 我 们 希望 启动 然后 停止 一 个 服务 器 进程 。 接 着 ,我 们 就 可 以 往 服务 器 发 送 请 


求 ， 查 看 响应 的 内 容 。 







































































我 们 可 以 用 concurrent .futures 模块 创建 一 个 独立 的 子 进程 来 运行 服务 器 。 下 面 的 代码 
段 展 示 了 可 以 成 为 单元 测试 用 例 一 部 分 的 某 种 处 理 过 程 。 


import concurrent.futures 









































import time 


with concurrent.futures.ProcessPoolExecutor() as executor: 


executor.submit( roulette server, 4 ) 
time.sleep(2) # Wait for the server to start 


json get () 
json get () 
json get ("/european/") 
json get ("/european/") 

















接着 ， 





通过 创建 concurrent .futures .ProcessPoolExecutor 实例 创建 了 一 个 独立 的 进程 。 

















我 们 使 用 适当 的 参数 值 向 这 个 服务 器 请 求 了 一 个 函数 。 


















































在 本 例 中 ， 我 们 运行 了 json_get () 客户 端 函数 两 次 ， 用 于 读 取 默认 路 径 一 一 /。 然 后 ， 用 
GET 请 求 了 两 次 "/european/"。 

executor.submit () 函数 让 进程 池 执 行 roulette_server (4) 函数 。 现 在 服务 器 会 处 理 
4 个 请 求 ， 然 后 终止 。 由 于 ProcessPoolExecutor 是 一 个 上 下 文 管理 器 ， 因 此 可 以 保证 所 有 的 
资源 都 会 被 适当 地 释放 。 单 元 测试 输出 的 日 志 包 含 类 似 下 面 这 样 的 内 容 。 
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wheel '‘'european' 
127.0.0.1 - - [08/Dec/2013 09:32:08] "GET /european/ HTTP/1.1" 200 62 
200 OK 
[('Date', 'Sun, 08 Dec 2013 14:32:08 GMT'), ('Server', 'WSGIServer/0.2 
CPython/3.3.3'), ('Content-type', ‘'application/json; charset=utf-8'), 
('Content-Length', '62')] 
{ 20 TE35y 下 人 TEven se , [Ly Tl “Black te [ds; Lj ~ HE Ly] 
wheel 'european' 是 wheel () WSGI 应 用 程序 输出 的 日 志 。127.0.0.1 - - [08/Dec/2013 
09:32:08] "GET /european/ HTTP/1.1" 200 62 是 WSGI 服务 器 输出 的 默认 日 志 ， 用 于 展 








示 已 经 成 功 地 完成 了 请 求 的 处 到 
接 下 来 的 3 行 是 json_get () 的 输出 。200 OK 是 
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于 




















会 作为 服务 器 响应 的 一 部 分 返 














务 器 发 到 客户 端的 。 在 本 例 ! 


， 赢 家 是 20 Black。 





同时 ， 请 注意 ， 我 们 原本 
含 '20': (35, 
请 注意 , 我 们 上 









































1) 。 经 过 编码 和 解码 之 后 ， 








的 元 素 在 经 过 JSON 的 编码 和 解码 之 后 被 转变 为 了 列表 。 原 本 的 字 





























第 1 个 print () 函数 输出 的 。 这 些 内 容 
回 给 客户 端 。 最 后 , 我 们 打印 了 经 过 解码 的 字典 对 象 ， 这 个 对 象 是 从 服 






































| 




















"来 确 











地 使 用 name ”== "main 
必须 只 能 被 用 来 提供 定义 。 我 们 必须 确 
六 下 name == " 














main ": 





roulette server() 


这 里 得 到 的 结果 是 '20' : 
来 测试 的 模块 会 由 ProcessPool 服务 器 导入 。 这 个 导入 的 过 程 还 会 定位 所 指 
定 的 函数 ，roulette_server ()。 由 于 服务 器 会 在 测试 中 导入 模块 ， 因 出 
保 这 个 模块 不 会 在 导入 过 程 中 执行 外 
保 在 定义 服务 器 的 脚本 中 使 用 这 利 


[35, 





1]。 

















所 














[测试 
E 何 其 人 


的 模块 必须 正确 
由 的 处 理 过 程 ， 它 





























12.4 使 用 可 回调 类 创建 WSG1 应 用 程序 


我 们 将 WSGI 应 用 程序 实现 为 callable 对 象 而 不 是 
务 器 上 使 用 有 状态 的 处 理 过 程 ， 这 样 的 过 程 不 会 有 潜在 的 全 








构造 方法 。 


六 的 函数 。 这 让 我 们 可 以 在 WSGI 有 





br 
































get_spin() WSGI 应 用 程序 依赖 于 两 个 全 局 变量 ，american 和 european。 应 | 
秘 的 。 

















之 间 的 绑 定 可 能 是 非常 了 





























局 变量 导致 的 混乱 。 在 之 前 的 例子 中 ， 






































定义 一 个 类 的 目的 是 将 处 理 过 程 和 数据 都 封装 进 一 个 单独 的 包 中 ， 可 以 




















好 地 封装 我 们 的 应 用 程序 。 这 个 
将 Wheel 扩展 为 可 回调 WSGI 




















from collections.abc 
class Wheel2( Wheel, 





def _call (self, environ, start response): 




















应 用 程序 。 


import Callable 
Callable ): 





winner= self.spin() # 3. Evaluate. 
status = '200 OK' # 4. Respond. 
headers = [('Content-type', 


charset=utf-8')] 


start response (status, 


return [ 


headers) 








'application/json; 


json.dumps (winner) .encode ('UTF-8') ] 











] Callable 对 象 更 
可 以 让 有 状态 的 wheel 和 WSGI 应 用 程序 间 绑 定 更 清晰 。 下 











程序 和 全 局 变量 














四 的 类 
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我 们 扩展 了 基 类 whee1， 这 个 扩展 类 包含 了 WSGI 接口 。 这 个 类 中 没有 对 请 求 做 任何 解析 ， 
WSGI 处 理 过 程 被 削减 为 只 剩 两 个 步骤 ;运行 和 响应 。 我 们 会 在 更 高 层 的 封装 应 用 程序 中 处理 解析 
和 日 志 。Whee12 应 用 程序 只 是 简单 地 读 取 某 个 结果 然后 将 它 编 码 为 男 一 个 结果 。 

请 注意 ， 我 们 在 Whee12 类 中 添加 了 一 个 特别 的 特性 。 这 是 定义 了 一 个 不 属于 Wheel 中 is-a 
定义 的 部 分 例子 ， 这 更 偏向 于 一 个 acts-as 特性 。 或 许 ， 这 应 该 被 定义 为 mixin 或 者 一 个 装饰 器 ， 而 
不 是 类 的 一 等 特性 。 

下 面 是 实现 了 欧洲 式 轮 盘 和 美国 式 轮 盘 的 两 个 子 类 。 


class American2( Zero, DoubleZero, Wheel2 ) : 




































































































































































pass 


class European2( Zero, Wheel2 ) : 
pass 


这 两 个 子 类 依赖 于 基 类 中 的 _call _() 方 法 函数 。 正 如 前 面 的 例子 所 示 ， 我 们 使 用 mixin 向 
wheel 中 添加 合适 的 零 bins。 

我 们 将 wheel 从 一 个 简单 对 象 变 为 了 一 个 WSGI 应 用 程序 。 这 意味 着 更 高 层 的 封装 应 用 程序 就 可 以 
变 得 稍微 简单 一 些 。 相 比 于 算出 其 他 对 象 的 值 ， 更 高 层 的 应 用 程序 现在 只 用 简单 地 将 请 求 委 托 给 对 
象 本 身 。 以 下 是 一 个 修改 后 的 封装 应 用 程序 ， 它 选择 要 旋转 的 轮 盘 并 且 将 请 求 委 托 给 对 应 对 象 。 

class Wheel13( Callable ) : 


def _ init ( self ) : 
self.am = American2 () 



































































































































self.eu = European2 () 
def _call (self, environ, start response) : 
request= wsgiref.util.shift path info (enViron) # 1. Parse 
print( "Wheel3", request, file=sys.stderr ) # 2. Logging 
if request .LIower () .startswith('eu'): # 3. Evaluate 
response= self.eul(lenviron,start response) 
else: 
response= self.am(environ,start response) 


return response # 4. Respond 





当 创建 whee13 类 的 实例 时 ， 它 会 创建 两 个 wheels。 每 个 wheel 都 是 一 个 WSGI 应 用 程序 。 
当 请 求 到 达 时 ，wWhee1l3 WSGI 应 用 程序 会 解析 请 求 。 然 后 ， 它 会 将 两 个 参数 (environ 和 
start_ response 函数 ) 传递 给 另外 一 个 应 用 程序 执行 真正 的 处 理 过 程 并 且 创建 响应 结果 。 在 许 
多 情况 下 ， 这 个 委托 操作 也 会 包含 用 从 请 求 路 径 或 者 报头 中 解析 而 来 的 参数 更 新 environ 变量 。 
最 后 ，Whee1l3. call () 函数 会 调用 其 他 应 用 程序 所 得 的 结果 作为 响应 返回 给 客户 端 。 

这 种 风格 的 委托 是 WSGI 应 用 程序 所 特有 的 。 这 是 WSGI 应 用 程序 互相 之 间 可 以 非常 优雅 地 
结合 的 原因 。 注 意 ， 在 封装 程序 中 ， 有 两 个 位 置 可 以 注入 处 理 逻 辑 。 

@ 在 调用 另 一 个 应 用 给 程序 之 前 ， 它 会 修改 环境 来 添加 一 些 信 息 。 

@ 在 调用 了 另外 的 应 用 程序 之 后 ， 它 可 以 修改 响应 文档 。 
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通常 ， 我 们 会 专注 























用 人 
12.4.1 








个 对 象 定义 一 个 字符 串 类 型 的 键 。RESTful 的 Web 服务 器 有 相同 的 需求 ， 它 要 求 必须 定义 一 个 合理 
追踪 每 个 对 象 。 
也 可 以 作为 RESTful 的 Web 服务 的 标识 符 。 我 们 可 以 很 容易 地 将 这 个 键 用 














的 键 ， 这 个 键 可 以 被 | 
一 个 简单 的 代理 
于 shel 











| 4 











ve 或 sqlite。 


要 的 











晶 . 
候 





耳 





这 里 








的 一 部 分 。 例 如 
j 于 多 个 作者 共 


ey 


> 









































] 于 明确 


部 对 象 


于 在 封装 程序 ， 
E 何 额外 的 信息 更 新 环境 。 


设计 RESTful 对 象 标识 符 
序列 化 对 象 的 过 程 涉 及 为 每 个 对 象 定义 某 种 标识 符 。 对 于 
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C 




















修改 环境 。 但 是 ， 在 本 例 中 ， 上 


Im 











和， 因此 不 必 


于 
或 


日 于 请 求 非 











要 。 





重 














个 





于 
本 





。 当 纯粹 的 管 


| 机 














一 个 RESTful 的 应 月 
基本 标 i 














做 标识 符 。 在 博 
， 会 将 标题 ' 









































对 了 








程序 可 
只 应 该 永远 不 会 随 着 索引 的 改变 或 者 习 
对 于 相对 简单 的 对 象 ， 我 1 
客 的 例子 ， 
的 标点 和 空格 用 “_” 蔡 换 。 这 样 
变 都 不 会 变化 的 标识 符 。 增 加 或 者 改变 索引 不 会 改变 博文 的 基本 标识 符 。 
门 必 须根 据 用 来 引用 这 些 更 复杂 对 象 的 粒度 确 
客 的 例子 ， 我 们 将 博客 作为 一 个 整体 ， 它 包含 了 若 3 
博客 的 URI 可 能 类 似 下 面 这 样 。 




















F 更 复杂 的 容器 对 象 , 我 


台 马 
能 会 





总 是 和 


通常 会 使 月 








功能 例如， 
提供 许多 索引 或 者 搜索 条 件 。 但 是 ， 





同 创作 的 文章 ， 就 无 法 正确 表示 。 同 时 ， 当 一 个 作者 接管 了 另 一 个 


F shelve 和 sqlite, 我 们 需要 为 每 
上 


























cool URIs don't change” 参见 http://www.w3.org/Provider/ Style/URI.html。 
对 于 我 们 而 言 ， 定 义 一 个 永远 都 不 变 的 URI 非常 
9 客 程序 可 能 需要 文 持 多 个 作者 。 


下 
要 


巴 对 象 有 状态 的 部 分 
日 织 博客 中 文章 的 文 


乍 者 的 文 


的 是 ， 永 远 不 要 
如 果 基 于 作者 





















































有 权 ) 改变 时 ， 我 们 不 希望 改变 URI。 








下 引 


发 布 日 


有 而 改变 。 
E 够 找到 菜 种 标识 符 一 一 例如 ， 数 据 库 的 代理 键 常 被 用 






































区 别 某 个 资源 或 者 对 象 的 




















期 (大 
故 的 目 
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为 不 会 改变 ) 和 标题 作为 标识 符 。 其 




















的 是 创建 一 个 无 论 网 站 的 结构 如 何 改 
定 标识 符 。 继 续 看 博 











独 的 文章 。 

















































































































/microblog/blog/bid/ 

最 高 层 的 名 字 (microblog) 代表 整个 应 用 程序 。 接 下 来 是 资源 的 类 型 (blog)， 最 后 是 某 
个 实例 的 ID。 

但 是 ， 一 篇 文章 的 URI 可 能 有 几 种 不 同 的 选择 。 

/microblog/post/title string/ 

/microblog/post/bid/title string/ 

/microblog/blog/bid/post/title string/ 

当 不 同 的 博客 中 有 标题 相同 的 文章 时 ， 第 1 个 URI 就 无 法 使 用 了 。 在 这 种 情况 下 ， 为 了 让 标 
题 唯 一 ， 某 个 作者 可 能 会 看 到 他 们 的 标题 后 追加 了 “_2?” 或 者 其 他 的 一 些 可 以 让 标题 唯一 的 装饰 。 


不 过 ， 我 们 一 般 不 推荐 这 检 








做 。 











| 
站 











第 2 个 URI 

















了 博客 ID (biq) 作为 上 下 文 或 者 命名 空间 来 确 














下 文中 是 唯一 的 。 这 利 








技术 经 常 被 扩展 为 包括 











他 分 支 ， 例 如 











保 Post 的 标题 在 当前 博客 的 上 
日 期 ， 这 样 可 以 进一步 缩小 搜索 范围。 




















J 























第 3 个 例子 中 显 式 使 用 


法 的 缺点 是 路 径 更 长 ， 但 是 这 让 





了 两 层 class/object 
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的 名 称 : plog/bid 和 post/title string。 这 种 做 
个 复杂 的 容器 可 以 内 置 包 含 多 个 元 素 的 不 同 集合 。 
请 注意 ，REST 服务 会 影响 为 持久 化 存储 而 定义 的 API。 实 际 上 ， 定 义 URI 和 定义 接口 的 方法 


























门 选择 清晰 、 有 意义 并 





名 类 似 。 我 们 必须 为 它 


12.4.2 ”多 层 REST 服务 












































可 以 长 久 使 用 的 名 字 。 





















































下 面 是 一 个 更 智能 的 多 层 REST 服务 器 应 用 程序 。 我 们 会 分 成 不 同 部 分 进行 讲解 。 首 先 ， 需 要 
为 我 们 的 Wheel 类 提供 一 个 轮 盘 的 桌子 。 
from collections import defaultdict 
class Table: 
def jinit ( self, stake=100 ) : 
self.bets= defaultdict (int) 
self.stake= stake 
def Place bet( self, name, amount ) : 
self.bets[name] += amount 
def clear bets( self, name ): 
self.bets= defaultdict (int) 
def resolve( self, spin ) : 
"""spin is a dict with bet: (x:y).""" 
details= [] 
while self.bets: 
bet, amount= self.bets.popitem!() 
if bet in spin: 
x, y = spinlbet] 
self.stake += amount*x/y 
details.append( (bet, amount, 'win') ) 
else: 
self.stake -= amount 
details.append( (bet, amount, 'lose') ) 
return details 
Table 类 追踪 单独 匿名 玩家 的 bets。 每 个 bet 由 轮 盘 桌 上 的 一 个 区 域 的 名 称 和 一 个 整 型 金 
额 组 成 。 当 解析 bet 时 ，wheel 类 会 提供 一 个 旋转 一 圈 的 结果 给 reslove () 方法 。 接 下 来 ， 会 将 


























投入 的 注 和 旋转 所 赢得 的 注 比 较 ， 








并 且 根 据 是 否 赢得 了 更 多 的 注 调 



































整 玩 家 的 筹码 。 


我 们 会 定义 一 个 RESTful 的 轮 盘 服务 器 ， 这 个 服务 器 会 向 我 们 展示 用 HTTP POST 实现 的 一 个 





















































































































































有 状态 的 事务 。 我 们 把 轮 盘 的 游戏 分 成 下 面 3 个 URI。 
@@ /player/ 
4 用 GET 方法 请 求 这 个 URI 会 获得 一 个 用 JSON 编码 的 dict， 这 个 gict 中 包含 了 所 
有 用 户 的 信息 ， 包 括 他 们 的 筹码 和 当前 已 经 玩 的 局 数 。 将 来 可 以 定义 一 个 合适 的 
Player 对 象 并 且 返 回 一 个 序列 化 的 实例 来 扩展 这 个 方法 。 
4 一 个 可 能 的 扩展 方式 是 处 理 PosT 请 求 ， 用 于 创建 下 注 的 其 他 用 户 。 
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@@ /bet/ 
























































4 ”用 PosT 请 求 这 个 URI 需要 包含 用 于 创建 投注 的 一 个 用 JSON 编码 的 dict 或 者 一 个 
dict 的 列表 。 每 个 投注 的 字典 都 包含 两 个 键 : bet 和 amount。 

4 ”用 GET 请 求 这 个 URI 会 得 到 一 个 JSON 编码 的 aict， 这 个 aict 用 于 向 我 们 展示 当 
前 的 投注 和 到 目前 为 止 的 总 金额 。 

@ /wheel/ 

4 ”用 不 带 参数 的 POST 请 求 这 个 URI 会 旋转 轮 盘 并 且 计 算 支 出 。 牧 门 用 PosT 实现 它 是 

为 了 强调 这 个 URI 会 改变 可 用 的 筹码 和 用 户 的 状态 。 

4 ”用 GET 方法 请 求 这 个 URI 可 能 会 返回 之 前 的 结果 ， 向 我 们 展示 上 次 旋转 的 结果 、 上 次 
的 支出 和 上 次 用 户 的 筹码 。 这 可 以 作为 不 可 以 否认 性 模式 的 一 部 分 ， 它 为 上 次 的 旋转 
返回 了 一 个 额外 的 副本 。 

下 面 为 WSGI 应 用 程序 家 族 定 义 的 两 个 帮助 类 。 


class WSGI( Callable ) : 
def _call ( self, environ, start response ) : 
raise NotIimplementedError 
class RESTException( Exception ) : 
pass 
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我 们 简单 地 扩展 了 callable， 在 这 个 类 中 我 们 显 式 地 声明 将 会 定义 一 个 WSGI 应 用 程序 类 。 









































我 们 也 定义 了 一 个 异常 类 ， 在 WSGI 应 用 程序 中 可 以 用 它 发 送 错误 状态 码 ， 这 些 状态 码 
和 wsgiref 中 表示 为 Python 一 段 错误 的 通用 错误 码 500 不 同 。 下 面 是 Roulette 服务 器 的 顶层 。 


class Roulettel( WSGI ) : 

def jinit ( self, wheel ): 
self.table= Table (100) 
self.rounds= 0 
self.wheel= wheel 

def _call ( self, environ, start response ): 
#print ( environ, file=sys.stderr ) 
app= wsgiref.util.shift Path info(environ) 


tr 
if app.lower() == "player": 
return self.player app( environ, start response ) 
elif app.lower() == "bet": 
return self.bet app( environ, start response ) 
elif app.lower() == "wheel": 


return self.wheel app( environ, start response ) 
else: 

raise RESTException("404 NOT FOUND", 

"Unknown app in {SCRIPT NAME.}/{PATH INFO}".format map (environ)) 
except RESTException as e: 

status= e.args[0] 
headers = [('Content-type', 'text/plain; charset=utf-8')] 
start response( status, headers, sys.exc info() ) 
return [ repr(e.args) .encode ("UTF-8") ] 
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我 们 定义 了 一 个 封装 了 其 他 应 用 程序 的 WSGI 应 用 程序 。wsgiref.util.shift path info() 
函数 会 解析 路 径 并 且 根 据 “/” 取 出 第 1 个 单词 。 基 于 这 个 单词 的 值 ， 我 们 会 调用 3 个 WSGI 应 | 
程序 中 对 应 的 那个 。 在 本 例 中 ， 每 个 应 用 程序 都 是 类 中 的 一 个 方法 函数 。 

我 们 还 定义 了 一 个 全 局 的 异常 处 理 器 ， 它 会 将 任何 RESTException 实例 转化 成 一 个 合适 的 
RESTful 响应 。 我 们 没有 处 理 的 异常 会 被 转化 为 wsgiref 提供 的 通用 状态 码 500。 以 下 是 
player_app 方法 函数 。 








































































































































































































def player app( self, environ, start response ) : 
if environ['REQUEST METHOD'] == 'GET': 


details= dict( stake= self.table.stake, rounds= self. 











rounds ) 

status = '200 OK' 

headers = [('Content-type', ‘application/json; 
charset=utf-8')] 

start response(status, headers) 


return [ json.dumps( details ) .encode('UTF-8') ] 
else: 











raise RESTException("405 METHOD NOT ALLOWED", 
"Method '{REQUEST METHOD}' not allowed".format map (environ)) 























我 们 创建 了 一 个 响应 对 象 一 一 details。 然 后 ， 我 们 将 这 个 对 象 序 列 化 为 一 个 JSON 字符 串 ， 
然后 再 用 UTF-8 将 这 个 字符 串 编码 为 字 节 。 
如 果 不 小 心 使 用 Post (或 者 Put 或 Delete) 请 求 /player/ 路 径 ， 程 序 会 抛 出 一 个 异常 。 顶 层 的 
__call () 方 法 会 捕获 这 个 异常 并 且 将 它 转化 为 一 个 错误 响应 。 

下 面 是 bet_app () 函数 。 





































































































def bet app( self, environ, start response ): 





























if environ['REQUEST METHOD'] == 'GET': 
details = dict( self.table.bets ) 
elif environ['REQUEST METHOD'] == 'POST' : 


size= int (environ['CONTENT LENGTH"']) 
raw= environ['wsgi.input'] .read(size) .decode ("UTF-8") 
Sy 

data = json.loads( raw ) 

if isinstance (data,dict): data= [datal 

for detail in data: 


self.table.place bet( detaill['bet'], 
int (detail['amount']) ) 





except Exception as e: 
raise RESTException("403 FORBIDDEN", 
Bet {raw!r}".format (raw=raw)) 
details = dict( self.table.bets ) 
else: 


























raise RESTException("405 METHOD NOT ALLOWED", 


"Method '‘'{REQUEST METHOD}' not allowed".format map (environ)) 
status = "200 OK' 
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headers 


start response (status, 


return [ 









































[('Content-type', 


上 享 对 象 





headers) 





json.dumps (details) .encode ('UTF-8') |] 


> 










































































'application/json; charset=utf-8')] 































































































这 段 代 码 根 据 不 同 的 请 求 方法 会 执行 两 个 不 同 的 处 理 过 程 。 当 使 用 GET 方法 时 ， 结 果 是 当前 
投注 的 字典 。 当 使 用 PosT 请 求 时 ， 必 须 同时 传 进 一 些 用 于 定义 投注 的 数据 。 当 尝试 使 用 其 他 的 
HTTP 方法 请 求 时 ， 返 回 一 个 错误 。 

当 使 用 PosT 时 ， 投 注 的 信息 会 以 数据 流 的 方式 附加 在 请 求 中 。 我 们 必须 通过 一 些 步骤 来 读 取 
和 处 理 这 些 数据 。 第 1 步 是 用 environ['CONTENT_LENGTH' ] 的 值 确定 需要 读 取 多 少 字 节 的 数据 。 
第 2 步 是 解码 读 取 的 字 节 流 从 而 获得 客户 端 发 送 的 原始 字符 串 。 

我 们 用 JSON 编码 请 求 。 这 里 需要 强调 的 是 ， 这 不 是 浏览 器 或 者 Web 服务 器 处 理 HTML 表单 用 
POST 方法 发 送 的 数据 的 方式 。 当 使 用 浏览 器 从 HTML 表单 中 POST 数据 时 ， 所 谓 编码 只 是 简单 地 用 






































urllib .parse 模块 实现 的 一 系列 转 义 操作 。urllib.parse. parse =qs() 模块 函数 会 用 HTML 



























































































































































































































































发 送 的 数据 解析 编码 过 的 查询 字符 串 (query string )。 

对 于 RESTful 服务 ， 有 时 候 会 使 用 与 PosT 兼容 的 数据 ， 这 样 处 理 HTML 表单 的 过 程 就 会 和 
RESTful 的 处 理 过 程 非常 类 似 。 在 其 他 情况 下 ， 会 使 用 一 个 单独 的 编码 方式 ， 例 如 JSON， 来 创建 
比 Web 表单 生成 的 引用 数据 更 容易 使 用 的 数据 结构 。 

一 旦 我 们 获得 了 raw 字符 串 ， 就 可 以 用 json .1oads () 获取 这 个 字符 串 所 表示 的 对 象 。 本 例 中 ， 
我 们 期 望 获得 两 个 类 中 的 一 个 、 一 个 定义 投注 的 简单 aict 对象， 一 系列 定义 了 多 个 投注 的 aict 
对 象 。 作 为 一 种 简单 的 泛 化 ,我 们 让 单个 的 dict 对 象 成 为 一 个 只 包含 一 个 元 素 的 序列 。 这 样 就 可 














以 用 








个 通用 的 dict 实例 











注意 ， 我 们 的 异常 处 到 
的 设计 方式 是 使 ) 
任何 投注 的 memento 对 象 。 实 现 备忘录 模式 
包含 在 应 用 某 个 改变 之 前 所 有 投注 的 副本 。 当 





序列 表示 需要 的 投注 。 






































方法 会 留 下 一 些 投注 ， 但 是 返回 




















的 一 
异常 发 和 




















种 方法 是 用 


全 局 的 403 Forbidden 消息 。 更 好 


备忘录 (Memento) 模式 。 当 放置 投注 时 ， 我 们 可 以 同时 创建 一 个 可 以 | 
模式 。 备 筷 录 可 以 
时， 我 们 可 以 删除 已 损坏 的 版 本 ， 然 后 恢复 到 


Before Image 设计 














来 撤销 














前 一 个 状态 。 当 使 用 内 骨 的 可 变 对 象 容器 时 ， 这 个 过 程 可 能 会 非常 复杂 ， 


可 变 对 象 。 由 
对 于 PoOST 和 GE 


它 


发 





口 











这 个 类 的 最 后 一 个 部 分 是 

















于 这 个 程序 




















给 REST 客户 端 。 


这 个 











姑 为 我 们 必须 确保 复 和 














只 用 于 不 可 变 的 字符 串 和 整数 ， 为 table .bets 做 一 份 浅 拷 贝 就 足够 了 。 

















T 方法 ， 响 应 是 相同 的 。 我 们 将 taple .bets 字典 
响应 用 于 确认 投注 已 经 成 功 地 放置 到 台面 上 。 











def wheel app( sel 

















if environl['REQU. 


size= enV 


EST METHOD'] 


wheel_app () 方 法。 


If, environ, start response ) : 
== 'POST': 


iron['CONTENT LENGTH'] 

















序列 化 为 JSON， 


if size != "10: 
raw= environ['wsgi.input'] .read(int (size)) 
raise RESTException("403 FORBIDDEN", 
"Data '{raw!r}' not allowed".format (raw=raw)) 


spin= sel 


f.wheel.spin() 





payout = self.table.resolve( spin ) 


判 了 所 有 














然后 将 
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self.rounds += 1 
details = dict( spin=spin, payout=payout, 
stake= self.table.stake, rounds= self.rounds ) 
status = '200 OK' 
headers = [('Content-type', ‘application/json; 
charset=utf-8')] 
start response(status, headers) 
return [ json.dumps( details ) .encode('UTF-8') ] 
eelse: 
raise RESTException("405 METHOD NOT ALLOWED", 
"Method '{REQUEST METHOD}' not allowed".format 


























map (environ)) 






































这 个 方法 首先 确认 客户 端 是 通过 一 个 无 参 的 PosT 请 求 调用 它 的 。 这 样 做 是 为 了 确 





















































地 关闭 了 套 接 字 ， 并 且 已 经 读 取 并 忽略 了 所 有 数据 。 这 样 做 可 以 避免 一 个 写 得 很 差 的 客户 端 在 遇 到 


套 接 字 中 仍然 有 未 读 的 数据 时 骨 溃 的 问题 。 
































旦 处 理 完 这 些 问 题 ， 那 么 剩 下 的 就 是 旋转 轮 盘 、 解 析 不 同 的 投注 和 生成 一 个 包含 旋转 的 结果 、 





保 经 1 E 确 



















































































来 序列 化 这 个 对 象 、 编 码 为 UTF-8 并 且 将 它 发 回 给 客户 端 。 























请 注意 ， 我 们 避免 了 处 理 多 个 玩家 的 问题 。 这 会 在 /player/ 路径 下 增加 一 个 类 和 另外 一 





























个 POST 方法 。 它 会 添加 一 些 定义 ， 并 且 有 一 些 额 外 的 信息 需要 记录 。 创 建新 玩家 的 POST 处 理 过 






































支出 、 玩 家 的 筹码 和 目前 进行 轮 次 的 响应 。 这 个 结果 会 存储 在 dict 对 象 中 。 然 后 ， 我 们 会 用 JSON 





程 和 放置 投注 的 处 理 过 程 类 似 。 这 是 一 个 很 有 趣 的 练习 ， 但 是 不 会 涉及 任何 新 的 编程 技术 。 
































12.4.3 ”创建 roulette 服务 器 


















































def roulette server 3(count=1): 
from wsgiref.simple server import make server 
from wsgiref.validate import validator 
wheel= American() 
roulette= Roulette (wheel) 
debug= validator (roulette) 
httpd = make server('', 8080, debug) 
if count is None: 
httpd.serve forever() 
else: 
for c in range (count): 
httpd.handle request () 














旦 我 们 创建 了 可 回调 的 roulette 类 ， 就 可 以 用 下 面 的 方式 创建 一 个 WSGI 服务 器 。 


这 个 函数 创建 了 轮 盘 WSGI 应 用 程序 一 一 roulette。 它 用 simple server. make server () 





























创建 了 一 个 服务 器 ， 这 个 服务 器 会 用 roulette 可 回调 对 象 处 理 每 个 请 求 。 











在 本 例 中 , 我 们 也 包含 了 wsgiref.validate.validator() WSGI 应 月 
序 用 于 验证 roulette 应 用 程序 使 用 的 接口 ， 它 会 用 assert 语句 装饰 各 种 API 来 



























































昌 程 











提供 一 些 诊断 信息 。 





















































万 一 需要 考虑 WSGI 应 用 程序 中 更 严重 的 编程 问题 时 ， 它 也 提供 了 一 些 更 易 读 上 
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12.4.4 创建 roulette 客户 端 

















Sp 


门 为 需要 请 求 的 服务 定 

我 们 会 定义 一 个 和 
这 个 客户 端 可 以 作为 专门 为 轮 盘 定 表 
的 通用 客户 端 。 


def roulett 


制 的 函数 。 






































_client (method="G 


if data: 
header= {"Content-type": 
params= json.dumps( data ) 
rest.request (method, path, 
else: 
rest.request (method, path) 
response= rest.getresponse() 


raw= response.read() 


] RESTful 客户 端 API 来 定义 模块 是 一 利 


各 种 RESTful 服务 器 兼容 
1 的 客户 端的 基本 组 成 。 下 面 是 一 个 可 以 使 用 Roulette 服务 器 


ET" > path="/" 
rest= http.client.HTTPCoNnection("' 


\ 也 


划 











改 法 。 








常 ， 客 户 端的 API 中 会 包含 一 些 专 





常见 的 




















的 通用 客户 端 ， 而 不 是 去 定义 一 些 专 月 





目的 客户 端 。 











data=None): 


localhost', 8080) 


"application/json; charset=utf-8'"} 


"UTF-—8.") 


header) 


.encodel( 


params, 


.decode ("utf-8") 


if 200 <= response.status < 300: 


document= json.loads (raw) 


return document 
else: 
print( 
print( response.getheaders 
print( raw ) 


response.status, response.reason 


) 


() ) 














客户 端 会 发 起 GET 或 者 POST 请 求 ， 








它 会 将 POST 请 求 的 数据 编码 为 JSON 文档 。 请 注意 ， 























用 JSON 编码 请 求 数据 如 


urllib.parse.urlencode() 








模块 函数 实 ] 





的 数据 返回 





with concurrent.futures.ProcessPool 


executor.submit( roulette server 3, 


time.sleep(3) # Wait for 七 
print( 


print( roulette client ("POST 


色 对 不 是 浏览 器 处 到 
岗 的 编码 方式 。 
我 们 的 客户 端 函数 将 JSON 文档 解码 ， 如 
。 这 个 区 间 中 的 状态 码 是 成 功 状态 


roulette _ client ("GET", 





HTML 表单 POST 数据 的 方式 。 浏 览 器 使 用 的 是 





r 



































TS 


果 状 态 码 处 于 [200,300) 
码 。 我 们 可 以 用 下 








开 区 间 ， 它 会 将 解码 后 
面 的 方式 试验 客户 端 和 服务 器 。 


























Executor() as executor: 


4 ) 
he server to start 


) ) 


"/player/" 
2 Eee 


下 'Black', ‘amount"':2}) 


) 





"GE 


已 





Print ( roulette client ( 


print( 








首 纪 
上 上， 请 求 是 roulette server 3(4 


在 本 例 ! 























roulette client ("POST", 
E， 我 们 创建 ProcessPool 1 我 们 向 
。 一 旦 服务 器 启动 ， 我 们 就 可 
， 我 们 请 求 了 4 次 。 A 接 有 





m 7 n/pet/" 3 六 


"/wheel/" ) ) 





服务 器 提交 了 一 个 请 求 ， 实 际 
以 尝试 和 服务 器 交互 了 。 
痢 ， 放 置 一 个 投注 ， 然 后 ， 查 看 投注 的 



































































































































12.5 创建 安全 的 REST 服务 281 























































































































状态 。 最 后 ， 转 动 轮 盘 。 每 个 步骤 中 ， 我 们 都 打印 了 响应 的 JSON 文档 。 

日 志 看 起 来 类 似 下 面 这 样 。 

127.0.0.1 - - [09/Dec/2013 08:21:34] "GET /player/ HTTP/1.1" 200 27 

{'stake': 100, 'rounds': 0} 

127.0.0.1 - - [09/Dec/2013 08:21:34] "POST /bet/ HTTP/1.1" 200 12 

{'Black': 2} 

127.0.0.1 - - [09/Dec/2013 08:21:34] "GET /bet/ HTTP/1.1" 200 12 

{'Black': 2} 

127.0.0.1 - - [09/Dec/2013 08:21:34] "POST /wheel/ HTTP/1.1" 200 129 

{'stake': 98, ‘'payout': ['Black', 2, 'lose']], 'rounds': 1, 'spin': 

{S274s [355 41s. “Oddr: [ls Jy.. "Reds [Ly Li "HEY [Ly 1 }} 

这 段 日 志 展 示 了 服务 器 响应 请 求 的 内 容 ， 在 台面 上 创建 投注 、 随 机 转动 轮 盘 并 用 结果 适当 地 更 
新 用 户 状态 。 

让 

12.5 创建 安全 的 REST 服务 

我 们 可 以 将 应 用 程序 的 安全 分 为 两 个 部 分 考虑 : 验证 和 授权 。 我 们 需要 知道 用 户 是 谁 ， 并 且 需 
要 确保 用 户 有 运行 某 个 WSGI 应 用 程序 的 授权 。 如 果 使 用 用 于 确保 凭证 间 加密 传 输 的 HTTP 的 
Authorization 头 ， 实 现 这 种 安全 机 制 就 相对 容易 。 














































































































































































































































































































如 果 我 们 使 用 SSL， 就 可 以 简单 地 使 用 HTTP 基本 授权 (HTTP Basic Authorization ) 模式 。 这 
个 版 本 的 Authorization 头 会 在 每 个 请 求 中 包含 一 个 用 户 名 和 密码 。 对 于 更 复杂 的 验证 机 
制 ， 可 以 使 用 HTTP 摘要 授权 (HTTP Digest Authorization)， 这 种 授权 需要 与 服务 器 交换 信息 
首 且 获得 名 为 nonce 的 数据 ， 这 块 数据 用 于 以 更 安全 的 方式 创建 摘要 。 

通常 , 我 们 会 尽早 地 在 执行 过 程 中 完成 身份 认证 的 处 理 。 这 意味 着 前 端的 WSGI 应 用 程序 会 检 
查 Authorization 头 并 且 更 新 环境 信息 或 者 返回 一 个 错误 。 理论 上 , 我 们 将 使 用 一 个 提供 了 这 种 
功能 的 完整 的 Web 框架 。 关 于 这 方面 的 更 多 信息 ， 请 阅读 下 节 中 对 这 些 Web 框架 的 讨论 。 

关于 安全 性 的 主题 ， 最 重要 的 建议 可 能 是 下 面 这 条 。 

永远 不 要 保存 密码 





KY 





唯一 可 以 存储 的 是 一 个 “加 盐 ” 的 重复 加 密 的 哈 希 密码 。 密 码 本 
恢复 的 ， 仔 细 研 究 “Salted Password Hashing” 或 者 


身 必须 是 不 可 


下 载 一 个 实现 了 这 种 加 密 的 可 信和 库 


编码 后 的 密码 。 





。 永 远 不 要 存储 一 个 明文 或 者 


下 面 的 示例 类 向 我 们 展示 了 salted password hashing 是 如 何 工 作 的 。 


from hashlib import sha256 


import os 


class Authentication: 
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iterations= 1000 
def _init ( self, username, password ) : 
"""Works with bytes. Not Unicode strings."™"" 


self.username= usernam 





self.salt= os.urandom(24) 
self.hash= self. iter hash( self.iterations, self.salt, username, password) 


Qstaticmethod 
def iter hash( iterations, salt, username, password ) : 
seed= salt+b":"+username+b":"+t+password 


for i in range (iterations): 
seed= sha256( seed ) .digest() 
return seed 
def eq ( self, other ): 
return self.username == other.username and self.hash == other.hash 
def hash ( self, other ): 
return hash(self.hash) 
def _ repr ( self ): 
salt x= "".join( "{0:x}".format (b) for b in self.salt ) 
hash x= "".join( "{0:x}".format (b) for b in self.hash ) 
return "{username} {iterations:d}:{salt}:{hash}".format( 
username=self.username, iterations=self.iterations, 
salt=salt x, hash=hash x) 
def match( self, password ) : 
test= self. iter hash( self.iterations, self.salt, self. 
username, password ) 
return self.hash == test # Constant Time is Best 





这 个 类 为 一 个 给 定 的 用 户 名 定义 了 Authentication 对 象 。 这 个 对 象 包括 用 户 名 、 一 个 每 次 
设置 或 者 重 设 密码 时 都 会 创建 的 唯一 的 随机 salt。 类 中 也 提供 了 用 于 确定 给 定 密码 与 原始 密码 是 否 能 
够 生成 相同 哈 希 码 的 方法 一 一 match () 。 


请 注意 ， 我 们 没有 保存 密码 。 我 们 只 保存 了 密码 的 哈 希 码 。 在 比较 函数 上 写 了 注释 〈“# Constant 
固定 时 间 运 行 的 不 是 特别 快 的 算法 非常 适合 作为 这 种 比较 的 算法 。 































































































LU 








Time is Best”)。 一 种 需要 月 
我 们 还 没有 实现 它 。 

我 们 也 包含 了 一 个 相等 性 测试 和 一 个 哈 希 测试 用 于 强调 这 个 对 象 是 不 可 变 的 。 我 们 不 能 修改 任 
何 值 。 当 用 于 改变 密码 时 ， 只 能 丢弃 并 且 重 建 整个 Authentication 对 象 。 还 有 一 个 功能 是 用 
__slots 节省 存储 空间 。 

请 注意 ， 这 些 算法 需要 字 节 字符 串 而 不 是 Unicode 字符 串 。 我 们 需要 字 节 或 者 是 ASCII 编码 上 
Unicode 用 户 名 或 密码 。 以 下 是 如 何 创建 用 户 集合 的 代码 。 
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class Users( dict ): 


def _init ( self, *args, **kw ): 
super(). init ( *args, **kw ) 
# Can never match -- keys are the same. 


self[""]= Authentication( b" dummy ", b"Doesn't Matter" ) 
def add( self, authentication ) : 
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if _ authentication.username == "": 
raise KeyError( "Invalid Authentication" ) 

self[authentication.username]= authentication 
def match( self, username, password ) : 

if username in self and username != "": 

return self[username] .match (password) 
else: 

return self[""] .match(b"Something which doesn't match") 
































我 们 扩展 了 aict， 增 加 了 用 于 保存 Authentication 实例 的 ada () 方法 和 一 个 用 于 确定 用 
户 是 否 在 字典 中 并 且 拥 有 正确 和 任 证 的 match() 方 法 。 

请 注意 , match () 这 个 比较 方法 的 时 间 复 杂 度 必须 是 常数 。 当 客户 端 提供 了 一 个 未 知 的 用 户 名 
时 ， 我 们 会 创建 一 个 额外 的 假 用 户 。 通 过 与 假 用 户 比较 ， 虽 然 结 果 永 远 是 失败 的 ， 但 是 执行 时 间 不 会 
为 错误 的 验证 信息 提供 任何 提示 。 如 果 我 们 简单 地 返回 False, 那么 找到 一 个 不 匹配 的 用 户 名 会 比 
找到 不 匹配 的 密码 快 。 

我 们 特别 禁止 了 设置 验证 或 者 匹配 值 为 ““ 的 用 户 名 。 这 样 做 的 目的 是 确保 假 用 户 名 永远 不 会 
成 为 一 个 可 能 可 以 匹配 的 正确 用 户 名 ， 并且 任何 尝试 匹配 它 的 操作 都 会 失败 。 下 面 是 我 们 创建 的 一 
个 示例 户 。 
























































































































































































































































































































































users = Users () 
users.add( Authentication(b"Aladdin", b"open sesame") ) 


如 果 想 看 到 这 个 类 内 部 发 生 了 什么 ， 可 以 手动 创建 一 个 用 户 。 


>>> al= Authentication(b"Aladdin", b"open sesame") 

>>> al 

b'Aladdin' 1000:16f56285edd9326282da8c6aff8d602a682bbf83619c7f:9b86a2a 
dlae0345029aellde402ba661lade577df876d89b8a3e182d887a9f7 


这 里 的 salt 是 一 个 24 字 节 字符 串 ， 当 用 户 的 密码 被 创建 或 者 修改 时 ， 它 都 会 被 
希 码 是 包含 了 用 户 名 、 密 码 和 salt 的 重复 散 列 。 
WSGI 验证 程序 


且 我 们 能 够 保存 用 户 和 验证 信息 ， 就 可 以 查看 请 求 的 Authentication 头 了 。 下 面 的 WSGI 
程序 查看 Authentication 头 ， 并 且 为 正确 的 用 户 更 新 环境 信息 。 



































置 。 这 个 哈 
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import base64 
class Authenticate( WSGI ) : 
def _init ( self, users, target app ) : 
self.users= users 
self.target app= target app 
def _call ( self, environ, start response ) : 
if 'HTTP AUTHORIZATION' in environ: 
scheme, credentials = environ['HTTP AUTHORIZATION'] .split() 


if scheme == "Basic": 
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username, password=base64.b64decode( credentials ) .sSP1LiL(b" : 


if self.users.match (username, password): 


environ['Authenticate.username']= username 


return self.target app (environ, start response) 


"401 UNRAUTHORIZED 
headers [('Content-type', 
('WWW-Authenticate', 


status 





















































































































































































































































































































































'text/plain; charset=utf-8°'), 
"Basic realm="roulette@localhost"')] 












































start response (status, headers) 
return "Not authorized" .encode ("utf-8") | 
这 个 WSGI 应 用 程序 除了 一 个 目标 应 用 程序 之 外 ， 还 包含 一 个 用 户 池 。 妆 我 们 创建 这 个 
Authenticate 类 的 实例 时 ， 会 提供 另 一 个 WSGI 应 用 程序 一 一 target_app， 这 个 封装 的 程序 
只 会 看 到 通过 验证 的 用 户 请 求 。 当 Authenticate 程序 被 调用 时 ， 它 会 执行 一 些 测试 以 确保 请 求 
来 自 一 个 已 经 通过 验证 的 用 户 。 
@ 必须 提供 一 个 HITP Authorization 头 。 这 个 头 以 HTTP_AUTHORIZRATION 为 键 保存 在 
environ 字典 中 。 
头 的 验证 模式 必须 是 Basic。 
Basic 模式 提供 的 验证 信息 必须 是 用 base64 编码 的 username+b" :"+tpassword， 这 段 信 
息 必 须 和 某 个 已 定义 用 户 的 验证 信息 匹配 。 
如 果 上 面 的 所 有 测试 都 通过 了 ， 就 可 以 用 已 验证 用 户 的 用 户 名 来 更 新 environ 字典 。 然 后 ， 目 标 
程序 就 会 被 调用 。 
然后 ， 处 理 授 权 的 程序 就 会 知道 当前 用 户 是 已 经 经 过 验证 的 。 这 种 解 耦 的 设计 是 WSGI 程序 的 
一 个 优雅 的 特性 ， 我 们 把 身份 验证 放 在 了 另外 一 个 地 方 。 














12.6 用 Web 应 用 程序 框架 实现 REST 



































于 一 个 REST Web 服务 器 就 是 一 个 Web 应 用 程序 ， 因 此 可 以 使 用 任 





























可 流行 


入 Python Web 应 ) 















































序 框架 。 在 发 现 了 某 个 框架 带 来 了 一 些 无 法 接受 的 问题 后 ， 我 们 可 以 考虑 从 头 3 
务 器 。 在 许多 情况 下 ， 用 框架 做 一 个 原型 能 帮助 我 们 弄 清 任何 问题 ， 并 且 可 以 ; 
的 REST 应 用 程序 做 一 个 详细 的 比较 。 


























各 它 与 没有 使 / 


j 程 


开始 编写 RESTful 服 











匡 架 














Python 的 一 些 Web 框架 包括 了 一 个 或 者 多 个 REST 模块 。 某 些 情况 下 ，RESTful 的 功能 几乎 





> 








内 置 的 。 在 其 他 情况 下 ， 创 建 一 个 提 











件 可 以 月 














这 些 项 目 
这 8 


Components。 这 是 一 些 可 以 月 





的 目的 是 为 创建 Web 应 | 


l=} 
SAE 





程序 提供 一 个 相对 完整 有 
个 Python Web 模块 包 的 列表 : https 
来 支持 Web 应 用 程序 


的 环境 。 


















































于 发 的 小 工 








No 


最 少 的 代码 定义 RESTful Web 服务 。 
里 是 一 个 Python Web 框架 的 列表 : https://wiki.python.org/moin/Web Frameworks。 


://wiki.python.org/moin/Web 


在 PyPI 一 一 https://pypi.python.org 上 搜索 REST 会 得 到 很 多 包 。 很 明显 ， 有 许多 现 














成 的 解决 方案 可 以 使 ) 





Jo 














花 一 些 时 间 搜 索 、 下 载 并 
很 有 挑战 的 一 个 方面 。 自 




















学 习 一 些 ] 
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的 安全 工具 会 有 一 些 优势 。 
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multiprocessing 模块 | 














传输 到 


对 于 要 





化 技术 可 能 也 是 必需 的 。 但 是 ， 在 本 章 ， 
块 基于 pickle 来 编码 对 象 。 关 于 
ML、 Pickle、CSV 厦 
门 提供 了 一 些 相 对 简 和 
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我 人 
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使 用 




















他 进程 中 。 有 许多 多 











写 的 安全 算法 通常 都 有 














j 于 序列 化 和 








三 方 的 项 目 















































求 高 性 能 的 











程 (或 者 线程 ) 同时 更 改 
当面 对 一 个 问题 时 ,程序 员 会 想 ， 

















通过 RESTful 

















岗 成 的 框架 可 以 减少 一 些 开 发 时 的 开销 。 尤 
些 严 重 的 缺陷 ，) 


自 





E Python 











1 XML”。 我 人 


















































因为 没有 
又 都 有 
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processl | process2 | process3。 这 种 shell 


生生 
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POSIX 


multiprocessing 模块 
多 个 sink 进程 发 散 的 
可 以 对 多 个 源 进程 结果 进行 合并 站 
为 了 最 大 化 计算 书 








~ 村 


对象 。 








个 输入 队列 和 一 个 输出 


ultiprocessing 的 到 
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人 








， 安 全 性 是 
| 一些 别人 写 的 已 经 经 过 证 明 
































传输 对 象 。 我 们 可 以 用 队列 和 管道 序列 化 对 象 ， 然 后 
都 提供 了 完整 的 消 
multiprocess 队列 ， 因 为 它 是 Python 内 置 的 一 个 非常 优秀 的 


应 用 程序 , 可 能 需要 























县 队列 的 实现 。 我 们 这 里 着 重 介绍 
队列 。 

一 个 更 快 的 消息 队列 。 使 
， 我 们 只 关 沪 





























比 pickling 更 快 的 序列 


十 问题 。multiprocessing 模 














这 方面 的 更 多 信息 可 














以 参见 第 9 


门 无 法 简单 地 提供 一 个 带 有 限 
的 安全 措施 以 防止 unpickle 问题 。 
multiprocessing 时 ， 有 一 个 很 重要 的 设计 问 











章 “ 序 列 化 和 保存 一 一 JSON、 
制 的 unpickler， 这 个 模块 为 





考虑 : 通常 最 好 禁止 多 个 进 





享 对 象 。 同 步 和 锁 的 问题 非常 严重 
“我 要 用 多 线程 。 
的 Web 服务 或 者 multiprocessing 使 

















基本 的 设计 原则 是 将 处 到 





shell 管道 有 
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每 个 处 ] 
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目 ' 进 


儿 系 统 的 看 
操作 系统 进程 


门 需要 通过 多 次 使 


当 任 意 给 定 的 
到 模拟 游戏 ， 
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。 队 列 
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十 数据 。 这 虽 
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里 : 








| 
的 请 求 都 可 以 作为 一 个 Python 对 象 。 multiprocessing 模块 会 序列 化 对 象 ， 这 样 





民 制 | » 
站 创建 包含 多 个 消费 玫 
含 多 个 消费 者 计 





台 忆 
Be 





























省 和 所 
每 个 管道 ! 








管道 
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只 有 











(并 且 很 容易 出 错 )， 所 以 有 一 个 笑话 




















过 程 看 作 一 个 由 许多 离散 的 步 又 组 成 的 
队列 ， 这 个 步骤 会 获取 一 个 对 象 、 执 行 一 些 处 理 过 程 ， 然 后 更 新 对 象 。 
E 念 和 POSIX 中 shell 管道 的 概念 类 似 ， 这 种 管道 











三 | 
XEo 


j 进 程 级 别 的 同步 可 以 避免 同步 问题 ， 


Ar 


首 道 。 每 个 处 理 步 
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令 通常 写作 


























涉及 3 个 通过 管道 互相 连接 的 3 
道 与 multiprocessing 的 主要 不 同 是 , 在 使 用 multiprocessing 时 不 需要 使 用 


并 且 显 式 地 序列 化 对 象 。 我 们 可 以 相信 multiprocessing 模块 对 操作 系统 级 基础 事务 的 处 理 。 


发 进程 。 这 种 
STDIN、STDOUT 















































的 消息 队列 。 

















的 管道 。 














] 的 模拟 操作 。 








吐 量 ， 我 们 需要 有 足够 的 等 待 ， 














[我们 可 以 通过 


个 生 F 





者 和 一 个 消费 者 。Python 的 
这 人 允许 我 们 定义 可 以 从 源 进程 向 





















































它 就 可 以 通过 队列 传输 到 另外 一 个 进程 中 。 





























个 单独 的 sink 进程 创建 一 个 








的 工作 ,这 样 就 不 会 有 空闲 的 处 理 
企 等 待 一 个 资源 时 ， 应 该 至 少 有 另 一 个 进程 准备 运行 。 

j 玩 家 策略 或 者 下 注 策略 〈 或 者 都 使 
改 法 是 创建 一 个 处 理 请 求 的 队列 ， 这 样 我 们 计算 机 的 处 理 器 〈 和 核心 ) 
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在 第 14 章 “Logging 和 Warning 模块 ”中 ， 当 我 们 介绍 logging 模块 如 何 使 用 multi 
rocessing 队列 为 每 个 生产 者 进程 提供 单一 、 集 中 的 日 志 时 ， 会 再 次 讲解 这 点 。 在 这 些 例 子 中 ， 
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帮 
1 














E 进 程 间 传 递 的 对 象 是 1ogging .LogRecord 实例 。 


2.7.1 定义 进程 





























我 们 必须 把 每 个 处 理 步 又 设计 成 一 个 简单 的 循环 ， 从 队列 中 读 取 请 求 、 处 理 请 求 ， 然 后 将 结果 
传递 给 另外 一 个 队列 。 这 样 的 设计 将 很 大 
































的 问题 分 解 为 若干 阶段 ， 这 些 
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这 些 阶 段 会 并 发 执行 ， 因 此 我 们 可 以 最 大 化 地 利用 系统 资源 。 此 外 ， 由 于 
取 数 据 和 将 结果 存 入 独立 队列 中 的 操作 ， 因 此 不 会 再 有 复杂 的 锁 或 者 共享 对 象 带 来 的 各 种 问题 。 一 


个 进程 可 以 是 一 个 简单 的 函数 或 者 一 个 可 回调 对 象 。 我 们 会 主要 介绍 进 
ultiprocessing.Process 的 子 类 ， 这 样 的 做 法 为 我 们 提供 了 最 大 的 灵活 性 。 
回 到 我 们 的 模拟 游戏 ， 我 们 可 以 将 模拟 过 程 分 解 为 3 个 步 又 的 管道 。 
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段 组 成 了 一 个 
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天 姐 。 


























些 阶段 只 包含 简单 的 获 












































1. 一 个 全 局 的 驱动 者 将 模拟 请 求 放 入 处 理 队 列 中 (processing queue)。 
2. 处 于 模拟 器 池 的 模拟 器 会 从 处 理 队 列 中 获取 请 求 ， 执 行 模拟 操作 ， 然 后 将 结果 放 入 结果 队 



































列 (results queue) ! 




















3. 摘要 者 (summarizer) 会 从 结果 队列 中 获取 结果 ， 然 后 创建 一 个 最 














使 用 进程 池 让 我 们 能 够 并 发 执行 CPU 可 以 接受 的 最 大 数量 的 模 

















配置 ， 来 确保 模拟 操作 能 以 最 快速 度 执行 。 




















以 下 是 模拟 器 进程 的 定义 。 


import multiprocessing 





class Simulation( multiprocessing.Process ): 
def _init ( self, setup queue, result queue ): 
self.setup queue= setup queue 
self.result queue= result queue 
super(). init () 
def run( self ) : 
"""Waits for a termination™™"" 


print( self. class . name , "start" ) 





item= self.setup queue.get() 
while item != (None,None): 
table, player = item 


self.sim= Simulate( table, player, samples=1 ) 


results= list( self.sim ) 



































程 定义 为 









































self.result queue.put( (table, player, results[0]) 


item= self.setup queue.get() 
print( self. class . name , "finish" ) 








我 们 扩展 了 multiprocessing.Process。 这 意味 着 我 们 必须 做 两 
multiprocessing 交互 : 我 们 必须 保证 super () ._init__() 会 被 执行 ， 









































终结 果 的 列表 。 





























拟 操作 ， 模 拟 器 池 可 以 进行 适当 
) 
件 事情 确保 能 够 和 





























必须 重 载 run ()。 








在 run() 的 方法 体 中 ， 我 们 使 用 了 两 个 队列 。setup_queue 队列 实例 会 包含 Table 和 Player 
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对 象 的 两 个 元 组 。 进 程 会 利用 这 两 个 对 象 执行 模拟 操作 。 它 会 将 生成 的 3 个 元 素 的 元 组 作为 结果 放 
入 result_queue 队列 实例 中 。simulate 类 的 API 如 下 。 














class Simulate: 
def _init ( self, table, player, samples ) : 
def _iter ( self ): yields summaries 


迭代 器 会 根据 samples 请 求 的 数量 , 依次 返回 对 应 的 统计 结果 。 我 们 还 在 setup_queue 中 包含 了 
一 个 哨兵 对 象 (sentinel object)。 这 个 对 象 用 来 以 一 种 优雅 的 方式 终止 当前 的 处 理 过 程 。 如 果 不 用 哨 
兵 对 象 ， 我 们 就 会 被 迫 终 止 进程 ， 这 有 可 能 破坏 锁 和 其 他 的 系统 资源 。 以 下 是 Summarize 进程 的 
代码 。 


class Summarize( multiprocessing.Process ) : 

























































































def _init ( self, queue ) : 
self.queue= queue 
super(). init () 

def run( self ): 
"""Waits for a termination™™"" 


print( self. class . name , "start" ) 





count= 0 
item= self.queue.get() 
while item != (None, None, None): 
print( item ) 
count += 1 
item= self.queue.get() 
print( self. class . name , "finish", count ) 


这 个 类 也 扩展 了 multiprocessing.Process。 在 本 例 中 ， 我 们 从 队列 中 获取 对 象 ， 然 后 简 
单 地 计算 它们 的 总 数 。 一 个 更 有 用 的 进程 可 能 会 用 一 些 collection.Counter 对 象 来 累加 一 些 更 
有 趣 的 统计 数据 。 

和 Simulation 类 一 样 ， 我 们 也 会 检测 哨兵 对 象 然后 优雅 地 关闭 处 理 进 程 。 使 用 哨兵 对 象 让 我 
们 在 进程 完成 工作 时 及 时 地 关闭 处 理 过 程 。 在 一 些 应 用 程序 中 ， 子 进程 可 能 不 会 被 关闭 ， 并 且 会 
致 运行 下 去 。 


12.7.2 ”创建 队列 和 提供 数据 


创建 队列 包括 创建 multiprocessing .Queue 或 者 它 的 某 个 子 类 的 实例 。 在 本 例 中 ， 我 们 可 
以 用 以 下 方式 创建 队列 。 


































































































































































































setup gq= multiprocessing.Simpleoueue () 
results q= multiprocessing.SimpleQueue() 


我 们 创建 了 两 个 定义 处 理 管道 的 队列 。 当 我 们 将 一 个 模拟 请 求 放 入 setup_q 队列 中 时 ,我 们 预期 
Simulation 进程 会 取出 这 个 请 求 并 且 执行 模拟 过 程 。 这 个 步骤 应 该 生成 由 3 个 元 素 组 成 的 元 组 作为 
结果 ， 包 括 台 面 、 玩 家 和 results_q 队列 中 的 结果 。 这 个 三 元 组 的 结果 应 该 反 过 来 指定 Summarize 



























































































































































进程 需要 完成 的 工作 。 以 下 是 我 们 如 何 开始 一 个 summarize 进程 。 





result= Summarize( results q ) 
result.start () 


下 面 是 我 们 如 何 创建 4 个 并 发 的 模拟 进程 。 


simulators= [] 











for i in range (4): 
sim= Simulation( setup gq, results q ) 
sim.start() 
simulators.append( sim ) 


这 4 个 并 发 的 进程 会 竞争 工作 资源 , 每 个 都 会 试图 从 等 待 请 求 的 队列 中 获取 下 一 个 请 求 。 一 旦 
这 4 个 模拟 器 满载 ,未 处 理 的 请 求 会 开始 填充 队列 。 一 旦 队列 和 进程 都 进入 等 待 ， 驱动 者 函数 就 可 以 
开始 将 请 求 存 入 setup_q 队列 中 。 以 下 代码 中 的 循环 会 生成 大 量 的 请 求 。 

table= Table( decks= 6, limit= 50, dealer=Hit17(), 


split= ReSplit (), payout=(3,2) ) 
for bet in Flat, Martingale, OneThreeTwoSix: 



















































































player= Player( SomeStrategy, bet(), 100, 25 ) 
for sample in range(5): 
setup dq.put( (table, player) ) 


我 们 创建 了 一 个 Table 对 象 ， 为 3 种 下 注 策略 各 创建 一 个 Player 对 象 并 且 将 一 个 模拟 请 求 插入 
到 队列 中 。simulation 对 象 会 从 队列 中 获取 并 处 理 pickled 的 双 元 组 。 为 了 能 够 有 序 地 终止 这 4 个 
模拟 器 ， 需 要 为 每 个 模拟 器 定义 哨兵 对 象 并 插入 队列 中 。 


for sim in simulators: 










































































setup q.put( (None,None) ) 


for sim in simulators: 


sim.join() 

我 们 在 队列 中 为 每 个 模拟 器 各 添加 一 个 可 以 消费 的 哨兵 的 对 象 。 一 旦 所 有 的 模拟 器 都 消费 了 哨 
兵 对 象 ， 我 们 等 待 进程 结束 然后 回 到 父 进 程 中 。 
旦 Process .join () 操作 结束 ， 不 会 再 创建 任何 模拟 数据 。 我 们 可 以 在 模拟 操作 的 结果 队 
列 中 也 添加 一 个 哨兵 对 象 。 


results q.put( (None,None,None) ) 


































































































result .join() 
旦 结果 队列 中 的 哨兵 对 象 处 理 完成 ，summarize 进程 会 停止 接受 输入 ， 这 时 我 们 可 以 使 
用 join () 将 其 返回 父 进程 。 
我 们 用 multiprocessing 将 对 象 从 一 个 进程 传输 到 另外 一 个 进程 , 这 让 我 们 可 以 用 一 种 相对 
简单 的 方法 创建 高 性 能 、 多 重 处 理 的 数据 管道 。 由 于 multiprocessing 模块 使 用 了 pickle， 
因此 对 于 对 象 行为 的 限制 几乎 无 法 通过 管道 实现 。 










































































































































































12.8 总 结 


/AN 二 


我 们 介绍 了 用 RESTful Web 服务 、wsgiref 模块 和 m 
些 技术 架构 都 为 对 象 状态 表示 的 交互 提 














它 表 示 状 态 的 方式 。 如 果 创 建 RESTful 





我 们 只 关注 JSON， 






























































通过 WSGI 应 月 























的 功能 、 序 列 化 结果 
容易 地 创建 复合 应 用 程序 和 封装 程序 。 我 们 经 
性 中 身份 验证 的 部 分 。 















































我 们 还 介绍 了 








恩 队列 的 好 处 是 我 们 可 以 避免 并 发 更 














| 
人 站 


multiprocessing 将 消息 插入 
tk 享 对 象 所 























新 








12.8.1 设计 要 素 和 折 中 方案 
我 们 也 必须 决定 允许 访问 的 对 象 粒 度 





很 容易 地 就 可 以 实现 ACID 属性 。 

















1 





Web 服务 ， 必 须 
对 为 它 被 广泛 应 用 而 且 实 现 非 
程 
并 且 提 供 响应 的 过 


日 是 ， 在 我 们 的 应 有 





C= 时: 


选择 使 ) 
号 则 蛙 。 
六 框架 执行 RESTful Web 服务 统一 接收 HTTP 请 求 、 
程 。 由 于 WSGI 应 用 程 


站 :证 壮 














澡 通 过 封装 





ultiprocessing 模块 传输 和 共享 对 象 ， 
具 了 支持 。 如 果 使 用 multiprocessing， 那 么 pickle 会 作为 
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许多 框架 也 会 

















序 的 API 简单 、 
的 程序 以 一 种 简单 
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HH 
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传 太 多 数据 。 在 一 些 情况 下 ， 我 们 需要 提供 
程序 请 求 数据 的 一 个 子 集 时 用 于 快速 1 
] 可 以 用 multiprocessing 模块 实现 更 集中 的 处 
机 或 者 多 个 主机 的 网 络 ! 
些 情况 下 ， 我 们 会 合 3 




















应 ) 





我 人 
信赖 的 主 
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不 同 的 访 
向 应 的 小 对 象 。 
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使 ) 




















管道 处 理 




















processing 


。 传 统 的 使 用 











multiprocessing 技术 通过 











12.8.2 ”模式 演变 





为 RESTful 服务 开发 公用 的 API 时 , 我 


























我 们 需要 


的 轻 度 改变 不 会 影 
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EL 





ET 




















| 建 高 性 能 的 处 理 
两 种 设计 
了 mod wsgi 插 


门 必须 注意 模式 江 


0 





























以 及 如 何 通 过 清晰 的 URI 标识 它们 。 如 果 使 / 
程序 的 例子 



































里 过 程 ， 











上 昌 划 。 


模式 ， 


























么 要 如 何 修改 响应 消息 呢 ? 如 果 为 了 与 其 他 的 程序 兼容 ， 必 须 修 改 外 部 





升级 Python 的 Web 服务 来 支持 改变 的 API 吗 ? 
通常 ， 我 们 必须 为 API 提供 一 个 
过 包含 在 POST 、P 


区 别 对 


要 的 发 布 版 本 号 。 
请 求 中 的 数据 字段 隐 式 地 提供 。 
待 不 会 修改 URI 路 径 或 








Fe 各 已 日 
已 月 E > 下 


可 能 显 式 地 作为 路 








哪些 表示 方式 。 在 本 章 的 例子 
提供 简单 
反 序 列 化 对 象 、 执 行 请 求 
准 ， 因 此 我 们 可 以 很 
、 一 致 的 方式 处 理 安全 


， 这 也 可 能 会 导致 下 载 或 
问 级 别 ， 支持 ACID 属性 的 大 对 象 、 当 客户 端 


这 种 方式 主要 是 











的 XML 实现 。 





























tk 享 队列 或 者 从 共享 队列 中 移 除 消 息 。 使 用 消 
来 的 锁 问 题 。 











j 大 对 象 ， 
上 





























为 了 在 一 个 可 


这 样 RESTful 的 请 求 就 会 由 multi 
牛 的 Web 服务 器 (例如 Apache HTTPD) 可 以 用 
个 命名 管道 将 请 求 从 Apache 的 前 端 传递 到 WSGI 应 用 程序 的 后 台 。 


























变 的 问题 。 如 果 我 们 修改 了 类 的 定 


的 RESTful API， 那 


于 





的 一 




















向 应 的 情况 和 会 修改 URI 或 者 响应 的 情况 。 功 能 























中 





URI 或 者 响应 的 结构 。 
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人 不 
改变 URI 或 六 
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应 的 结构 可 

















能 会 影响 正在 运行 的 应 用 程序 ， 这 些 属于 
以 正常 工作 的 一 种 方法 是 通过 模式 升级 在 URI 路 径 中 包含 版 本 号 。 例 丸 





























主要 改变 。 让 应 用 程序 仍然 可 
1，/roulette 2/wheel/ 指 定 
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了 roulette 服务 器 的 第 2 个 发 布 版 本 。 


12.8.3 ”应 用 程序 软件 层次 


于 使 用 sqlite3 时 , 应 用 程序 会 变 得 相对 复杂 , 我 们 的 应 用 程序 软件 必须 层次 化 得 更 合理 。 
对 于 一 个 REST 客户 端 ， 我 们 可 以 看 作 一 个 多 层 的 软件 架构 。 
当 我 们 创建 RESTful 服务 器 时 ， 表 示 层 会 被 极 大 地 简化 。 它 被 缩减 为 只 需要 处 理 基本 的 请 求 - 
响应 。 它 解析 URI 然后 用 JSON 或 者 XML 文档 (或 者 一 些 其 他 的 表示 方式 〉 响应 客户 端 。 这 层 应 
该 被 简化 为 一 个 封装 了 低层 功能 的 精简 的 RESTful 外 观 。 

在 一 些 复杂 的 例子 中 , 用户 浏览 的 最 前 端的 应 用 程序 包含 的 数据 来 自 多 个 不 同 的 数据 源 。 集 成 
来 自 不 同 数据 源 的 数据 的 一 种 简单 方法 是 将 每 个 数据 源 封 装 在 一 个 RESTful API 中 ， 这 为 我 们 访问 
不 同 的 数据 源 提供 了 统一 的 接口 。 这 样 的 设计 让 我 们 可 以 编写 以 统一 的 方式 收集 这 些 不 同 源头 的 
数据 。 


12.8.4 展望 
在 下 一 章 中 , 我 们 将 介绍 如 何 使 用 持久 化 技术 处 理 配置 文件 。 一 个 可 以 人 工 修改 的 文件 是 可 配 


置 数据 的 主要 要 求 。 如 果 我 们 使 用 一 个 大 家 都 很 熟悉 的 持久 化 模块 ， 那 么 我 们 只 需 编写 很 少 的 代码 ， 
应 用 程序 就 可 以 解析 并 验证 配置 数据 。 
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配置 文件 是 对 象 持久 化 的 一 种 


状态 可 编辑 的 表示 。 我 们 将 对 第 9 章 “ 序 列 化 和 保存 一 一 JSON、YAML、Pickle、CSV 和 XML” 





























另外 ， 如 果 有 纯 文 本 的 可 编辑 的 配置 文 伯 





























有 关 对 象 的 序列 化 内 容 进行 扩展 ， 创 建 配置 文件 。 

















第 13 章 
配置 文件 和 持久 化 















































攻 式 。 它 包括 了 一 个 序列 化 的 、 在 应 用 程序 或 服务 器 中 对 默认 


F， 也 必须 将 应 用 定义 为 可 配置 的 。 进 一 步 说 ， 我 们 必须 为 


点 用 程序 定义 一 些 可 用 的 配置 对 象 〈 或 集合 )。 在 许多 情况 下 ， 会 有 一 系列 的 系统 级 的 默认 值 ， 并 多 




















许 





考虑 


3 





































































































户 可 以 对 这 些 值 进行 编辑 。 有 关 配 置 数据 ， 将 介绍 6 种 表达 方式 。 














































































































































































































@ 作为 Windows 最 早 的 一 部 分 ，INI 文件 格式 的 流行 部 分 原因 在 于 它 是 被 系统 使 用 的 ， 而 且 
许多 其 他 配置 文件 会 用 到 这 个 格式 。 

@ PY 文件 是 纯 Python 代码 。 它 有 一 些 优势 ， 因 为 使 用 起 来 很 熟悉 ， 并 且 简 单 。 

@ JSON 或 YAML 的 可 读 性 都 很 强 并 且 编 辑 起 来 很 容易 。 

@ ”特性 文件 经 常用 于 java 环境 中 。 它 使 用 起 来 相对 简单 ， 并 且 可 读 性 强 。 

@ XML 文件 很 流行 , 但 是 传输 内 容 有 些 多 余 并 且 有 时 编辑 起 来 很 困难 。 在 Mac OS 中 使 用 了 

种 基于 XML 格式 的 特性 列表 ， 即 .plist 文件 。 
以 上 格式 的 每 一 种 都 各 有 优 缺 点 ， 也 不 存在 最 好 的 技术 。 在 许多 情况 下 ， 选 择 用 哪 种 技术 需要 





























与 其 他 软件 的 兼容 性 或 是 























在 社区 | 








1 配置 文件 的 使 用 场景 
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有 两 利 
e@ 














需要 编辑 
@ 软 人 
配置 文件 很 少 会 作为 





个 配置 文 























应 用 





配置 文件 的 使 用 场景 ， 有 些 可 


F 的 一 个 部 分 需要 读 配置 文件 3 














件 





以 添加 第 3 种 使 / 

















使 ) 


























的 主要 输入 。 一 个 例外 的 情况 是 ， 只 是 月 
作为 主要 输入 。 对 于 其 他 大 多 数 情况 ， 配 置 文件 不 是 3 

















很 熟悉 的 格式 。 




































































j 选 项 和 参数 来 修改 它 的 行为 。 


j 场 景 ， 如 下 两 种 场景 描述 得 很 清楚 。 






































定制 服务 器 的 行为 ， 但 Web i 











应 用 | 




















有 于 模拟 时 使 
要 输入 。 例 如 ，Web 服务 器 配置 文件 是 用 于 
青 求 是 主要 输入 之 一 ， 数 据 库 或 文件 系统 是 另外 的 主 
， 用 户 交 互 事 件 是 一 个 输入 ， 而 文件 或 数据 库 可 能 是 另 一 种 输入 ， 配 置 文件 只 对 应 用 适当 调控 。 
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配置 文件 















































输入 。 在 GUI 
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无 关 。 然 而 实际 上 ， 配 置 文件 会 为 已 有 的 应 用 程序 带 来 额外 的 策略 或 状态 ， 改 变 了 它 的 行为 。 寿 
种 情况 下 ， 配 置 文件 就 越过 了 那 条 线 ， 成 为 代码 的 一 部 分 ， 不 仅仅 是 代码 所 引用 的 一 个 配置 。 
3 种 可 能 的 场景 是 在 应 用 完成 更 新 后 将 配置 保存 到 一 个 文件 。 这 种 保存 对 象 状态 的 使 月 
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在 主要 输入 和 配置 文件 输入 之 间 的 界限 并 不 明显 。 理想 情况 下 ,应 | 



















































































































































































见 ， 因 为 配置 文件 中 保存 了 程序 的 操作 状态 ， 已 经 成 为 了 主要 输入 。 这 个 场景 意味 








文件 中 合 为 了 一 个 : 配置 参数 和 操作 状态 的 持久 化 ， 最 好 将 对 象 持久 化 设 i 














配置 文 


















































程序 行为 与 配置 文件 内 容 
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牛 会 为 应 用 程序 提供 很 多 类 型 的 参数 值 。 我 们 需要 适当 地 对 这 

















解 ， 然 后 决定 如 














默认 值 。 











设备 名 称 ， 可 能 


可 最 好 地 表示 它们 。 


与 文件 系统 的 位 置 重叠 。 





文件 系统 位 置 和 搜索 路 径 。 























网 络 名 称 ， 志 
可 选 行为 。 

















值 域 。 








这 些 值 是 相对 常见 


容易 。 对 于 Python 应 
在 一 些 情形 下 ， 





限制 和 边界 值 。 
消息 模板 和 数据 格式 的 指定 
消息 文本 ， 所 支持 的 国际 化 翻译 。 


安全 键 值 、 标 识 








也 址 和 端口 号 。 








、 用 户 名 和 密码 。 























































































































然 语言 。 























的 一 个 配置 项 ，1 























它 的 表示 并 不 像 简 单 类 型 





请 





re 

















一 些 额 外 的 功能 、 插 件 和 扩展 。 


这 是 有 挑战 的 ， 





个 对 象 。 当 插件 包含 了 更 多 Python 代码 时 ， 我 们 将 为 安装 好 的 Python 模块 提供 路 径 ， 
为 它 会 使 用 一 个 名 为 “package.modqule.object” 的 import 
































因为 我 们 无 需 为 应 用 程序 提供 简单 的 字符 串 值 。 











用 了 简洁 的 文本 。 我 们 可 以 

















首 这 两 种 对 象 已 经 在 
十 成 是 一 种 可 读 性 强 的 格式 。 








文 些 不 同类 型 的 数据 深入 理 
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并 
从 
到 
起 
相 
王 

















的 类 型 : 字符 串 、 整 型 和 浮 点 数 。 这 些 值 都 有 简洁 的 表示 并 且 编 辑 起 来 相对 
解析 用 户 输入 来 说 也 很 直接 。 
会 有 一 个 值 的 集合 。 例 如 ， 一 个 值 域 或 路 径 可 能 会 是 简单 类 型 的 集合 。 通 常 ， 
是 一 个 简单 的 序列 或 元 组 的 序列 。 通常 需要 为 消息 文本 使 用 一 种 类 似 字 上 典 的 映射 ， 次 
被 映射 为 自 定 义 的 E 
还 有 额外 
入 之 前 的 列表 中 。 


巴 这 一 项 加 


配置 为 应 用 程序 提供 了 一 





























大 



































语句 。 之 后 应 用 程序 就 可 























以 执行 “from package.module import object” 代 码 并 使 用 指定 的 类 或 函数 。 





对 了 





F 非 Python 代码 ， 我 们 有 另外 两 种 技术 来 完成 代码 的 导入 。 































































































对 于 不 能 正确 执行 的 二 进 制程 序 ， 会 试 着 使 用 ctypes 模块 来 调用 定义 好 的 API 方法 。 
对 于 可 以 执行 的 三 进 制程 序 ， 可 使 用 supprocess 模块 提供 的 一 些 方式 来 执行 它们 。 
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这 两 种 技术 都 不 是 只 针对 Python 的 , 关于 它们 的 介绍 到 此 为 止 , 深入 介绍 就 超出 了 本 章 的 范 
居 。 我 们 会 重点 关注 获取 参数 值 的 核心 问题 ， 这 些 值 是 如 何 使 用 的 是 一 个 很 大 的 主题 。 


13.2 ” 表示、 持久 化 、 状 态 和 可 用 性 


当 打 开 一 个 配置 文件 时 , 看 到 的 是 人 性 化 的 对 象 或 对 象 集合 的 状态 。 当 对 配置 文件 进行 编辑 时 ， 
我 们 改变 的 是 对 象 的 持久 化 状态 ， 这 个 对 象 在 应 用 启动 (或 重启 时 ) 将 被 重新 加 载 。 我 们 从 两 种 常 
见 的 角度 来 看 配置 文件 。 
@ 一 个 或 一 组 从 参数 名 到 值 的 映射 。 
@ 一 个 序列 化 了 的 对 象 ， 不 仅仅 是 一 个 简单 的 映射 。 
当 试 图 将 配置 文件 缩减 为 映射 时 , 我们 或 许 想 要 对 配置 文件 中 的 关系 范围 进行 限制 。 在 简单 的 
上 映射 中 ， 一 切 都 要 使 用 名 称 来 引用 ， 而 且 我 们 必须 克服 在 第 10 章 “ 用 Shelve 保存 和 获取 对 象 ” 以 
及 第 11 章 “ 用 SQLite 保存 和 获取 对 象 ” 中 所 介绍 的 键 的 设计 问题 〈 当 讨论 到 shelve 和 sqlite 
的 键 时 )。 我 们 为 配置 中 的 一 部 分 提供 了 一 个 唯一 的 名 称 ， 这 样 部 分 之 间 可 以 互相 引用 。 
以 日 志 信 息 为 例 来 看 一 下 它 是 如 何 完成 对 复杂 系统 进行 配置 是 有 帮助 的 。 在 Python 的 日 志 对 象 中 的 
关系 一 一 loggers、formatters、filters 和 handlers 一 一 在 创建 日 志 时 必须 同时 使 用 。 在 标准 库 的 第 16.8 节 中 ， 
介绍 了 日 志 配 置 文件 的 两 种 不 同 语法 。 我 们 将 在 第 14 章 “Logging 和 Warning 模块 ”中 进行 介绍 。 
在 一 些 情况 下 ， 对 复杂 的 Python 对 象 进行 序列 化 或 直接 使 用 Python 代码 作为 配置 文件 会 更 简 
单一 些 。 如 果 一 个 配置 文件 引入 了 太 多 的 复杂 度 ， 它 并 没有 多 少 实际 价值 。 


13.2.1 ”应 用 程序 配置 的 设计 模式 


有 关 应 用 程序 配置 有 两 种 核心 的 设计 模式 。 

@ 全 局 属性 映射 : 使 用 一 个 全 局 的 对 象 , 它 将 包含 所 有 的 配置 参数 。 它 可 以 是 name: value 的 
映射 对 或 是 包含 了 属性 值 的 对 象 。 它 将 使 用 单 例 设计 模式 来 确保 只 有 一 个 实例 。 

@ 对象 创 建 : 不 再 使 用 单 例 ， 而 是 定义 了 工厂 或 是 工厂 的 集合 ， 基 于 配置 数据 来 创建 应 用 程序 的 

对 象 。 这 样 一 来 ， 配 置信 息 只 在 程序 启动 时 被 使 用 一 次 。 配 置信 息 不 会 保存 在 全 局 的 对 象 中 。 

全 局 属性 映射 的 设计 非常 流行 ， 因 为 它 很 简单 并 且 容易 扩展 。 例 如 我 们 会 用 如 下 代码 定义 简单 对 象 。 


class Configuration: 
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some attribute= "default value" 


我 们 可 以 使 用 之 前 的 类 定义 作为 一 个 全 局 的 属性 容器 。 在 初始 化 时 ， 需 要 完成 部 分 配置 文件 的 
解析 逻辑 ， 如 下 代码 所 示 。 


Configuration.some _ attribute= "user-supplied Value" 









































在 程序 中 的 其 他 部 分 ， 就 可 以 使 用 configuration.some attribute 的 值 。 有 一 点 关于 
它 的 改进 是 使 用 正式 的 单 例 设计 模式 。 这 通常 由 一 个 全 局 模块 来 完成 ， 因 为 导入 会 相对 简单 ， 使 用 
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文件 


和 持久 化 








了 一 种 全 局 定义 的 访问 方式 。 


| 


settings= qict () 











解析 这 个 配置 文件 ， 





在 21 点 游戏 的 模拟 中 ， 可 


shoe= Deck ( 








使 ) 





j 应 用 将 使 ) 








Configuration.settings [ 


J 能 会 有 一 个 模块 名 称 为 configuration.py。 














在 这 个 文件 中 ， 可 能 会 有 如 下 的 定义 。 





现在 就 可 以 将 configuration.settings 看 作 是 应 用 设置 的 一 个 全 局 的 库 。 函 数 或 类 可 以 
的 配置 值 来 加 载 这 个 字典 。 























或 者 ， 可 能 会 看 到 如 下 的 这 段 代 码 。 


IfE bet > configuration.settings [ 












































能 会 看 到 如 下 代码 。 
'decks'] ) 
'limit']: raise InvalidBet () 

































































通常 情况 下 ， 我 们 避免 使 用 全 局 变量 。 因 为 全 局 变量 在 程序 的 任何 部 分 都 是 可 见 的 ， 它 可 能 会 
被 忽视 ， 可 以 使 用 对 象 的 构造 奉 代 全 局 变量 来 更 好 地 对 配置 进行 处 理 。 
































13.2.2 ”使 用 对 象 的 构造 完成 配置 





| 





使 用 对 象 

















提供 不 

















的 构造 配置 
同 的 初始 化 参数 。 


























通常 可 以 在 单 























将 创建 在 应 用 程序 














题 进行 展开 介绍 。 
现在 考虑 对 














21 点 游戏 





的 、 
使 用 的 对 











的 性 能 | 




















import csv 


青 况 。 这 些 变量 
量 可 能 包括 玩家 的 游戏 策略 ， 用 于 叫 
寺 投 注 或 一 些 更 特殊 的 投注 





时 可 能 包含 











应 用 程序 








全 局 


局 的 mai 








象 。 我 们 将 在 第 








时 , 目的 是 创建 所 需 的 对 象 。 配置 文件 需要 为 所 需 创建 的 对 象 
























































n () 函数 中 将 对 象 构建 的 初始 化 过 程 的 逻辑 进行 集中 人 处理 ， 它 
16 章 “ 使 用 命令 重 温 这 一 部 分 ， 并 对 这 些 设计 问 











上 9 




















人行 闻 [ 




















的 打 导 





策略 进行 模拟 。 当 运行 模拟 器 


时 ， 和 希望 统计 指定 的 自 变 量 组 合 


























系统 。 





def simulate blackjack (): 
dealer rule= Hit17() 
split rule= NoReSplitAces () 


table= Tablel( 
split=split rule, payout= 


decks=6, 


目 


一 开始 




















I 和 庄家 规则 。 变 
略 、 平 均 投 注 、 


晶 场 制度 ， 其 中 包括 牌 副 的 数量 、 桌 的 限于 
牌 、 停 叫 、 分 牌 和 双 倍 ， 也 包括 玩家 的 玩 牌 策 
代码 可 能 会 像 如 下 这 样 。 
































limit=50, dealer=dealer rule, 
(3,2) ) 


player rule= SomeStrategy () 
betting rule= Flat() 


player= Player( play=player rule, 


rounds=100, stake=50 ) 


simulator= Simulate( table, player, 
with open("p2 cl1l3 simulation.dat","w 


betting=betting rule, 


100 ) 


",newline="") as results: 


wtr= csv.writer( results ) 


for gamestats in simulator: 


wtr.writerow!( 


gamestats ) 
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这 只 是 一 种 快速 的 实现 版 本 ， 对 所 有 的 对 象 和 初始 化 值 进 行 了 硬 编码 。 我 们 需要 为 对 象 和 它们 
的 初始 化 值 添加 配置 参数 。 
Simulate 类 中 会 有 一 个 API， 代 码 如 下 。 


class Simulate: 








def _init ( self, table, player, samples ) : 
"""Define table, player and number of samples."™"" 
self.table= table 
self.player= player 
self.samples= samples 
def iter ( self ): 
"""Yieldq statistical samples."™"" 
这 样 一 来 ， 我 们 就 可 以 使 用 一 些 初始 化 参数 来 创建 Simulate () 对 象 。 一 旦 创建 了 一 个 
Simulate() 实例 ， 就 可 以 对 其 迭代 来 获取 一 系列 对 象 统计 的 信息 。 
有 趣 的 部 分 是 使 用 配置 参数 ， 而 非 类 名 。 例 如 ， 需 要 一 些 参数 来 标识 是 否 为 dealer_rule 的 值 创 
建 Hit17 或 stand17 的 实例 。 类 似 地 ，split_rule 的 值 可 用 于 不 同 的 类 中 ， 用 于 表示 牌 场 ， 
不 同 的 分 牌 规则 。 
对 于 其 他 情形 ， 参 数 被 用 来 为 类 中 的 _init__() 方 法 提供 参数 。 例 如 ， 
制 和 21 点 的 账单 都 将 作为 配置 项 用 于 创建 Table 实例 。 
旦 创建 了 对 象 ， 对 象 就 可 以 使 用 simulate .run () 方法 来 生成 静态 的 输出 。 不 再 需要 一 个 
全 局 的 参数 池 : 参数 值 会 通过 它们 的 实例 变量 绑 定 在 对 象 中 。 
对 象 创建 的 设计 不 像 全 局 特性 映射 那样 简单 。 它 的 好 处 是 ， 避 免 了 使 用 全 局 变量 ， 使 得 参数 的 
处 理 逻 辑 集 中 化 并 突出 了 一 些 主要 的 工厂 函数 的 使 用 。 
在 使 用 对 象 构建 模式 时 ， 添 加 新 参数 可 能 会 需要 对 应 用 程序 进行 重 构 ， 将 参数 或 关系 暴露 出 来 。 
比 起 从 名 称 到 值 的 全 局 映射 ， 它 的 处 理 过 程 显 得 更 复杂 。 
一 个 明显 的 优势 是 从 应 用 程序 中 移 除了 复杂 的 if 语句 。 在 使 用 策略 设计 模式 时 ， 更 倾向 
于 在 对 象 创建 时 才 做 决定 。 此 外 ， 简 化 了 逻辑 ，if 语句 的 消除 在 性 能 上 也 会 有 所 提升 。 


13.2.3 ”实现 具有 层次 结构 的 配置 


在 选择 配置 文件 的 位 置 时 ， 会 有 多 种 方案 。 以 下 有 5 种 常见 的 选择 , 我 们 可 以 使 用 它们 来 为 配 
置 参数 创建 具有 继承 层次 结构 的 配置 。 
@ 应 用 的 安装 路 径 : 实际 上 ， 它 们 和 基 类 的 定义 类 似 。 这 里 有 两 种 子 方案 。 小 的 应 用 可 以 安 
装 在 Python 的 库 结构 中 ， 初 始 化 文件 也 可 以 安装 在 那里 。 对 于 更 大 的 应 用 ， 通 常会 使 用 自 

定义 名 称 来 对 一 个 或 多 个 安装 目录 树 进行 命名 。 
4 Python 安装 目录 : 可 以 使 用 模块 中 的 ”file 属性 来 查找 一 个 模块 的 安装 位 置 。 在 
这 里 ， 可 以 使 用 os .path.split () 来 查找 配置 文件 。 
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副 的 数量 、 下 注 限 
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>>> import this 
>>> this. file 
'/Library/Frameworks/Python.framework/Versions/3.3/1ib/ 
Python3.3/this.py' 
4 应 用 程序 安装 目录 : 它 将 基于 自己 的 名 称 ， 因 此 可 以 使 用 ~theapp/ 和 os.path . 
expanduser () 来 追踪 配置 的 默认 值 。 
@ ”一 个 系统 级 的 配置 目录 : 它 通常 会 出 现在 /etc。 在 Windows 中 ， 它 会 被 转化 为 C:\etc。 可 以 选 
择 包含 os .environ['WINDIR'] 或 os .environ['ALLUSERSPROFILE'] 的 值 。 
@ 当前 用 户 的 home 目录 : 一 般 地 , 可 以 使 用 os .path.expanduser () 来 将 ~/ 转 换 为 用 户 的 
home 目录 。 在 Windows 中 ，Python 会 自动 使 用 8HOMEDRIVES 和 %HOMEPATHS 环 境 变 量 。 
@ 当前 工作 目录 : 通常 这 2 /， 尽 管 os .path.curdir 更 灵活 些 。 
@ 命令 行 参 数 中 命名 的 文件 : 这 是 一 个 显 式 命名 的 文件 ， 不 需要 对 命名 额外 地 处 理 。 
一 个 应 用 程序 可 以 同时 包括 i 从 基 类 (以 上 列表 的 第 1 个 ) 到 命令 行 参数 。 
使 用 这 种 方式 ， 安 装 默认 值 是 通用 的 并 且 很 少 包含 用 户 的 特殊 设置 ， 这些 值 可 以 使 用 用 户 指定 的 值 
来 重新 指定 。 
意味 着 通常 会 有 如 下 代码 所 示 的 一 个 文件 列表 。 
import os 
config name= "someapp.config" 
config locations = ( 
os.path.expanduser ("~thisapp/"), # or thisapp. file , 
"AeEC™; 
os.path.expanduser ("~/"), 
os.path.curdir, 
) 
candidates = ( os.path.join(dir,config name) 
for dir in config locations ) 
config names = [ name for name in candidates if os.path.exists (name) ] 
在 以 上 代码 中 ,得 到 了 一 组 文件 目录 并 通过 将 目录 与 配置 文件 名 进行 连接 , 创建 了 一 个 文件 名 列表 。 
旦 拿 到 了 配置 文件 名 列表 , 就 可 以 使 用 命令 行 参数 将 文件 名 附加 到 列表 的 最 后 面 , 如 下 面 代码 所 示 。 


13. 



















































































































































































config names.append (command 














line option) 

















它 将 返回 一 个 位 置 列表 ， 电 





























有 关 更 多 INI 文件 的 详细 内 容 ， 








http://en.wikipedia. 






































3 使 用 INI 文件 保存 配置 


INI 文件 格式 源 于 早期 版 本 的 Windows。 用 寺 
可 以 参见 Wikipedia 这 




















org/wiki/INI file。 


这 篇 文章 : 






























































于 配置 文件 或 配置 默认 值 的 查找 。 





解析 这 个 文件 的 模块 为 configparser。 





13.3 使 用 INI 文件 保存 配 297 
























































在 INI 文件 中 ， 每 个 部 分 包括 了 节 和 属性 。 在 我 们 的 主 程序 中 ， 包 括 了 3 个 部 分 : 表 配 置 、 
玩家 配置 和 全 局 模拟 器 数据 的 收集 。 
一 个 INI 文件 看 起 来 如 以 下 代码 所 示 。 


; Default casino rules 
[table] 
dealer= Hit17 
split= NoResplitAces 
decks= 6 
limit= 50 
payout= (3,2) 


















































; Player with SomeStrategy 
; Need to compare with Otherstrategy 
[player] 

play= SomeStrategy 

betting= Flat 

rounds= 100 

stake= 50 


[simulator] 
samples= 100 
outputfile= p2 cl1l3 simulation.dat 


我 们 将 参数 分 成 了 3 个 部 分 。 在 每 个 部 分 中 ,我们 提供 了 一 些 命名 的 参数 ， 它 们 与 类 名 和 之 前 
所 示 的 应 用 初始 化 模型 中 的 初始 化 值 相 对 应 。 
可 以 很 简单 地 对 单一 文件 进行 解析 。 


import configparser 
























































config = configparser.ConfigParser() 
config.read('blackjack.ini') 


我 们 创建 了 一 个 解析 器 实例 ， 然 后 将 目标 配置 文件 名 传 入 解析 器 。 解 析 器 会 读 取 文件 ， 查 找 划 
中 的 每 一 部 分 ， 并 对 每 个 部 分 中 所 包含 的 各 自 的 特性 进行 查找 。 

如 果 需 要 文件 支持 多 个 位 置 ， 可 以 使 用 config.read(config names) 。 当 为 Config 
Parser .read() 提供 一 个 文件 名 列表 时 ， 它 将 按 顺 序 读 取 每 个 文件 。 往 往 期 望 先 读 取 最 具 一 般 性 
的 ， 最 后 读 取 特殊 化 的 文件 。 通 用 的 配置 文件 为 软件 安装 的 一 部 分 ， 将 提供 用 于 解析 的 默认 值 。 而 
用 户 特 殊 指 定 的 配置 会 在 之 后 被 解析 ， 宪 盖 其 中 一 些 默 认 值 。 

且 完 成 了 文件 解析 ， 需 要 能 够 使 用 不 同 的 参数 和 设置 。 以 下 所 示 的 这 个 函数 ， 基 于 指定 的 
配置 对 象 完成 对 象 的 创建 ， 配 置 对 象 来 自 对 配置 文件 的 解析 。 我 们 将 这 个 过 程 分 为 3 个 部 分 ， 以 下 
| 建 Table 实例 的 部 分 。 
def main ini( config ) : 

dealer nm= config.get ('table', 'dealer', fallback='Hit17') 

dealer rule= {'Hit17': Hit17(), 


'Stand1l7': Stand1l7()}.get (dealer nm, Hit17()) 
split nm= config.get ('table','split', fallback='ReSplit') 
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split rule= {'ReSplit': 
NoReSplit (), 

'NoReSplitAces': 
decks= config.getint ('table', 'decks', 


'NoReSplit': 





limit= config.getint('table', 'limit', 
payout= eval( config.get ('table', 'payout', 


table= Tablel( 


decks=decks, 


配置 文件 和 持久 化 


ReSplit(), 
NoReSplitAces()}.get (split nm ReSplit()) 
fallback=6) 
fallback=100) 

fallback="' (3,2)') ) 


limit=limit, dealer=dealer rule, 


split=split rule, payout=payout ) 





























































































































































































































































































































在 INI 文件 中 的 [table] 部 分 ， 使 用 其 中 的 属性 来 选择 类 名 ， 并 提供 初始 化 值 。 主 要 存在 以 下 
3 种 情况 。 

@ 从 字符 串 映射 到 类 名 : 基于 字符 串 类 名 使 用 映射 来 实现 对 象 的 查找 。 上 例 用 来 创建 
dealer_rule 和 split_rule， 为 了 便于 修改 ， 可 以 将 这 个 映射 重 构 到 单独 的 工厂 方法 中 。 

@ 获取 一 个 值 ， 可 使 用 ConfigParser 来 解析 : 这 个 类 可 以 直接 处 理 str、int、float 
和 bool。 这 个 类 中 包括 了 一 个 复杂 的 映射 ， 从 字符 串 到 布尔 类 型 ， 使 用 了 大 量 的 公共 代 
人 码 以 及 True 和 False 的 同义词 。 

@ 非 内 置 类 型 的 处 理 : 对 于 payout 的 情况 ， 我 们 使 用 了 一 个 字符 串 值 ，' (3,2)'， 
Config.parser 中 并 没有 直接 支持 这 个 数值 类 型 。 有 两 种 方法 可 以 解决 这 个 问题 。 可 以 
自己 试 着 解析 , 或 者 把 它 的 值 当 作 合法 的 Python 表达 式 然后 使 用 Python 来 完成 。 这样 的 话 ， 
就 需要 使 用 eval () 函数 。 一 些 程序 员 会 认为 这 样 做 存在 安全 问题 。 下 一 节 会 对 此 进行 说 明 。 

以 下 是 这 个 例子 的 第 2 部 分 ,使 用 了 INI 文 件 中 的 [playez] 部 分 中 的 属性 来 选择 类 和 参数 值 。 


player nm= config.get ('player', 'play', 
player rule= {'SomeStrategy': 


bet nm= config.get ('player', 'betting', 
betting rule= {'Flat': 
Martingale(), 


rounds= config.getint ('player','rounds', 
stake= config.getint ('player','stake', 
player= Player( play=player rule, 
stake=stake ) 


它 使 ) 
策略 和 两 个 整 型 在 配置 文件 ' 











"AnotherStrategy ' : 


"Martingale ' : 
"OneThreeTwoSiX' : 


rounds=rounds, 






































fal 
SomeStrategy (), 
AnotherStrategy () } . 
fal 


lback='SomeStrategy') 


get (player nm, SomeStrategy ()) 
lback="'Flat') 





Flat (), 


OneThreeTwoSix()}.get (bet nm,Flat()) 
fallback=100) 
fallback=50) 
betting=betting rule, 

















了 从 字符 串 到 类 的 映射 和 内 置 的 数值 类 型 。 它 初始 化 了 两 个 策略 对 象 , 然后 基于 这 两 种 




















的 值 来 创建 Player 实例 。 









































以 下 是 最 后 一 部 分 ， 在 这 里 创建 了 全 局 的 模拟 器 。 


outputfile= config.get 
samples= config.getint ('simulator', 
simulator= Simulate( table, player, 
with open(outputfile,"w" 











wtr= csv.writerl( 
for gamestats in 
wtr.writerow( 


'outputfile',fallback='blackjack.csv') 
fallback=100) 


('simulator', 





'samples', 





samples ) 
rnewline="") as results: 
results ) 
simulator: 


gamestats ) 
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的 外 部 。outputfile 特性 用 





ery 


使 用 了 两 个 在 [simulation] 部 分 中 的 参数 ， 它 们 在 对 象 创建 范 上 上 
于 命名 一 个 文件 ，samples 特性 将 作为 参数 提供 给 方法 。 


13.4 使 用 eval 0 完成 更 多 的 文字 处 理 


配置 文件 中 可 能 会 包括 一 些 类 型 的 值 ， 它 们 并 没有 简单 的 字符 串 表 示 。 例 如 ， 集 合 可 能 会 作为 一 
个 元 组 或 1ist 文本 ， 一 个 映射 可 能 会 作为 一 个 dict 文本 。 我 们 有 不 同 的 选择 来 处 理 这 些 复杂 的 值 。 

这 些 选 择 围绕 着 一 个 问题 ， 就 是 转换 逻辑 需要 多 复杂 的 Python 语法 。 对 于 一 些 类 型 (int、 
float、bool、complex、decimal.Decimal 和 fractions.Fraction)， 可 以 安全 地 从 字符 
串 转 换 为 一 个 一 个 文本 值 ， 因 为 这 些 类 型 对 象 的 ”init _() 在 处 理 字符 串 时 不 需要 太 多 的 Python 语法 。 

然而 ， 对 于 其 他 类 型 ， 字 符 串 的 转换 就 不 是 那么 容易 了 ， 在 处 理 上 有 以 下 几 种 选择 。 

@ 禁止 使 用 这 些 类 型 ,使 用 配置 文件 的 语法 和 处 理 规 则 ,将 非常 简单 的 值 组 成 复杂 的 Python 

对 象 。 这 很 无 聊 但 却 是 有 效 的 。 

@ 使 用 ast.literal eval() 函 数 ， 因 为 它 可 以 处 理 Python 中 文本 值 的 许多 情 ; 

是 最 理想 的 方案 。 

@ ”使 用 eval () 直接 执行 字符 串 并 创建 所 需要 的 Python 对 象 。 这 种 方式 可 以 比 ast .literal_ 

eval () 函数 解析 更 多 类 型 的 对 象 。 而 这 种 级 别 广泛 性 是 否 真 的 必要 ? 

使 用 ast 模块 来 对 结果 对 象 进行 编译 和 审查 , 审查 过 程 会 检查 import 语句 和 一 些 允 许 使 用 模块 
的 小 集合 。 它 非常 复杂 ， 如 果 只 是 简单 的 则 不 做 审查 ， 或 许 应 该 定义 一 个 框架 而 不 是 使 用 应 用 程序 
和 配置 文件 。 

对 于 使 用 RESTful 的 情况 , 将 Python 对 象 通过 网 络 传输 , 使 用 eval () 直接 执行 文本 当然 是 不 
可 信任 的 。 参 见 第 9 章 “ 序 列 化 和 保存 一 一 JSON、YAML、Pickle、CSV 和 XML”。 

当 读 取 本 地 的 配置 文件 时 ，eval () 是 没 用 的 。 在 一 些 情况 下 ，Python 代码 的 修改 就 像 修改 配置 
文件 一 样 容易 。 当 可 以 直接 改 代码 时 ，eval () 就 不 是 那么 有 用 了 。 

这 里 是 使 用 ast.1iteral_eval() 代 替 eval () 的 代码 示例 。 














































































































































































































































































































。 这 通常 
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>>> import ast 
>>> ast.literal eval(' (3,2)') 
(3, 2) 


以 上 代码 放宽 了 配置 文件 中 的 值 域 。 它 虽然 不 支持 所 有 对 象 ， 但 是 它 支持 大 部 分 文本 。 
13.5 使 用 PY 文件 存储 配置 


PY 文件 格式 意味 着 使 用 Python 代码 作为 配置 文件 以 及 实现 应 用 程序 的 语言 。 我们 将 有 一 个 配置 
文件 ， 它 只 是 一 个 简单 的 模块 ， 配 置 文件 的 语法 就 是 Python。 这 样 就 不 需要 解析 过 程 。 
使 用 Python 时 需要 在 设计 上 注意 几 点 。 我 们 有 两 个 全 局 的 策略 来 使 用 Python 作为 配置 文件 。 
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@ ”一 个 最 上 层 的 脚本 : 在 这 种 情况 下 ， 配 置 文件 只 是 最 上 层 的 主 程序 。 
@ 一 个 exec0 的 导入 : 在 这 种 情况 下 ， 配 置 文件 需要 为 模块 的 全 局 变量 提供 参数 值 。 
我 们 可 以 设计 一 个 最 上 层 脚本 文件 ， 如 下 代码 所 示 。 


from simulator import * 
def simulate SomeStrategy Flat(): 

dealer rule= Hit17() 

split rule= NoReSplitAces () 

table= Table( decks=6, limit=50, dealer=dealer rule, 

split=split rule, payout=(3,2) ) 

player rule= SomeStrategy() 

betting rule= Flat() 

player= Player( play=player rule, betting=betting rule, 
rounds=100, stake=50 ) 

simulate( table, player, "p2 cl1l3 simulation3.dat", 100 ) 






















































































if name == " main ": 





simulate SomeStrategy Flat() 





























以 上 代码 意味 着 , 不 同 的 配置 参数 用 于 创建 和 初始 化 对 象 。 我 们 只 是 简单 地 将 配置 参数 写 入 代 
码 。 我 们 将 逻辑 提 到 了 一 个 单独 的 函数 simulate () 中 。 
使 用 Python 作为 配置 语言 的 一 个 劣势 是 Python 语法 潜在 的 复杂 性 。 基 于 两 点 原因 ， 这 个 问题 
通常 是 无 关 紧要 的 。 首 先 ， 如 果 在 设计 上 仔细 考虑 ， 配 置 的 语法 应 该 是 由 一 些 简 单 的 赋值 语句 例如 
() 和 , 组 成 。 其 次 ， 更 重要 的 一 点 是 ， 其 他 配置 文件 有 它们 自己 复杂 的 语法 ， 与 Python 的 语法 区 分 
开 了 。 只 使 用 一 种 语言 可 以 降低 复杂 度 。 
simulate() 函数 是 从 全 局 的 simulator 应 用 导入 的 ,这 /simulate() 函数 的 实现 可 能 会 
如 下 代码 所 示 。 











































































































































































































import csv 
def simulate( table, player, outputfile, samples ): 
simulator= Simulate( table, player, samples ) 
with open(outputfile,"w",newline="") as results: 
wtr= csv.writer( results ) 
for gamestats in simulator: 


wtr.writerow( gamestats ) 


这 个 函数 与 课 子 、 玩 家 、 文 件 名 和 其 他 例子 是 通用 的 。 

这 种 配置 技术 的 难点 在 于 缺少 方便 的 默认 值 。 最 上 层 的 脚本 必须 要 完成 : 所 有 的 配置 参数 都 必 
须 进行 设置 。 为 所 有 参数 都 赋值 可 能 显得 有 点 麻烦 ， 为 什么 要 为 很 少 使 用 的 参数 设置 默认 值 ? 

在 一 些 情况 下 , 这 点 没有 限制 。 对 于 一 些 默认 值 很 重要 的 场景 , 会 围绕 这 个 限制 介绍 两 种 方案 。 


13.5.1 ”使 用 类 定义 进行 配置 
使 用 最 上 层 脚 本 配置 有 时 遇 到 的 难点 是 缺少 方便 的 默认 值 。 为 了 提供 默认 值 ， 可 以 使 用 普 
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类 继承 。 以 下 是 我 们 如 何 使 用 类 定义 并 基于 配置 值 来 创建 对 象 的 。 


import Simulation 
class Example4( simulation.Default App ) : 

dealer rule= Hit17() 

split rule= NoReSplitAces () 

table= Table( decks=6, limit=50, dealer=dealer rule, 

split=split rule, payout=(3,2) ) 

player rule= SomeStrategy () 

betting rule= Flat() 

player= Player( play=player rule betting=betting rule, 
rounds=100, stake=50 ) 

outputfile= "p2 cl13 simulation4.dat" 





samples= 100 











这 样 的 话 ， 就 可 以 使 用 默认 配置 来 定义 Default_App。 所 定义 的 类 还 可 以 被 缩减 ， 只 提供 
Default_App 中 需要 被 重 写 的 值 。 

也 可 以 使 用 mixin 来 将 定义 分 为 可 重用 的 几 个 部 分 。 可 将 我 们 的 类 分 为 桌子 、 玩 家 和 模拟 器 组 
件 ， 然 后 通过 mixin 将 它们 组 合 在 一 起 。 有 关 mixin 类 设计 的 更 多 信息 ， 可 参见 第 8 章 “ 装 饰 器 
横 切 方面 ”。 

在 两 种 方式 中 ， 类 定义 的 使 用 到 达 了 瓶 贷 。 没 有 包含 方法 定义 ， 只 准备 使 用 这 个 类 来 定义 一 个 实例 。 
然而 ， 可 以 对 一 小 部 分 代码 段 进一步 缩减 ， 这 样 赋值 语句 就 会 只 在 很 小 的 命名 空间 中 ， 看 起 来 更 简洁 。 


可 以 修改 simulate () 函数 ， 类 定义 中 接收 一 个 参数 。 













































































和 mixin 




























































































def simulate c( config ): 
simulator= Simulate( config.table, config.player, config.samples ) 
with open(config.outputfile,"w",newline="") as results: 
wtr= csv.writer( results ) 
for gamestats in simulator: 


wtr.writerow( gamestats ) 
这 个 函数 从 全 局 的 配置 对 象 中 获取 了 相关 的 值 ， 然 后 用 于 创建 一 个 Simulate 实例 并 执行 。 执 
行 结果 与 之 前 例子 中 的 simulate () 函数 相同 , 但 是 参数 结构 不 同 。 以 下 代码 演示 了 如 何 为 函数 传 
递 单 一 实例 的 。 
















































































守 泪 name == " main ": 








simulation.simulate c (Example4 ()) 



































这 种 方式 的 一 个 小 缺陷 是 ， 它 与 用 于 从 命令 行 中 获取 参数 的 argparse 并 不 兼容 ， 可 以 使 用 
types .SimpleNamespace 对 象 来 解决 这 个 问题 。 











13.5.2 ”通过 SimpleNamespace 进行 配置 


我 们 可 以 使 用 types .SimpleNamespace 对 象 来 根据 需要 进行 属性 的 添加 ， 这 和 类 定义 是 类 似 的 。 
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修改 ， 
config5a 对 象 在 对 象 中 几乎 是 唯一 的 ， 它 的 创建 是 由 之 前 的 例子 中 的 Example4 () 方法 
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义 一 个 类 时 ， 所 有 的 赋值 语句 都 在 类 中 完成 。 当 创建 一 个 SimpleNamespace 对 象 时 ， 需 要 显 式 指 
每 一 个 需要 获取 的 Namespace 的 名 称 。 理 想 情 况 下 ， 可 以 使 用 如 下 代码 创建 SimpleNamespace。 
























































>>> import types 
>>> config= types.SimpleNamespacel( 
paraml= "some value", 
param2= 3.14, 
) 
>>> config 
namespace (paraml='some value', param2=3.14) 




















如 果 所 有 的 配置 项 相互 独立 ， 那 么 它 会 很 好 地 运行 。 然 而 ， 在 以 上 例子 中 ， 在 配置 中 存在 
的 依赖 。 可 使 用 以 下 两 种 方式 中 的 任意 一 种 来 解决 。 


@ 可 以 只 提供 依赖 项 的 值 ， 赋 值 操作 交 给 应 用 完成 。 
@ 可 以 在 递增 的 命名 空间 中 赋值 。 
只 创建 依赖 项 的 值 的 代码 如 下 。 


import types 



































































































































config5a= types.SimpleNamespacel( 
dealer rule= Hit17()， 
split rule= NOReSp1lLitAces ()， 
player _ rule= SomeStrategy ()， 
betting rule= Flat(), 
outputfile= "p2 cl3 simulation5a.dat", 
samples= 100, 
) 


config5a.table= Table( decks=6, limit=50, dealer=config5a.dealer rule, 
split=config5a.split rule, payout=(3,2) ) 





config5a.player= Player( play=config5a.player rule betting=config5a. 
betting rule, 
rounds=100, stake=50 ) 




















在 这 里 ， 使 用 了 6 个 互相 独立 的 值 为 配置 创建 了 SimpleNamespace。 然 后 ， 对 配置 进行 了 


























添加 了 两 项 ， 它 们 依赖 于 其 中 的 4 个 配置 项 。 

































































。 基 类 是 不 同 的 ， 属 性 集合 以 及 它们 的 值 是 唯一 的 。 下 面 是 另 一 种 方案 ， 在 最 上 层 的 脚本 ， 























创建 配置 。 


import types 

config5= types.SimpleNamespace() 

config5.dealer rule= Hit17() 

config5.split rule= NoReSplitAces() 

config5.table= Table( decks=6, limit=50, dealer=config5.dealer rule, 
split=config5.split rule, payout=(3,2) ) 





config5.player rule= SomeStrategy () 
config5.betting rule= Flat() 


本 
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config5.player= Player( play=config5.player rule, betting=config5. 
betting rule, 
rounds=100, stake=50 ) 
config5.outputfile= "p2 cl13 simulation5.dat" 
config5.samples= 100 


同样 的 ， 在 这 一 类 的 配置 上 ， 可 使 用 之 前 所 示 的 simulate_c() 方 法 。 
糟糕 的 是 ， 会 遇 到 在 使 用 最 上 层 脚 本 进行 配置 时 所 遇 到 的 同样 问题 。 没 有 简便 的 方法 来 为 配置 
对 象 提供 默认 值 ， 或 许 期 望 使 用 一 个 工厂 函数 来 执行 导入 操作 ， 其 中 包括 使 用 适当 的 默认 值 来 创建 


SimpleNamespace。 















































































































































From simulation import make config 
config5= make config () 














以 上 代码 执行 后 ， 就 可 从 工厂 函数 make_config () 中 获得 已 赋值 的 默认 值 。 每 一 个 用 户 指 定 
的 配置 只 需 提 供需 要 重 写 的 默认 值 。 



























































make_config () 函数 的 默认 实现 代码 可 能 如 下 。 
def make config(): 
config= types.SimpleNamespace () 
# set the default values 
config.some option = default value 
return config 


上 









































在 make_config () 函数 : 
值 进 行 设 定 。 


使 用 赋值 语句 对 默认 配置 进行 设置 。 然 后 应 用 
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config= make_config() 
config.some option = another Value 
simulate c( config ) 
































这 样 一 来 ， 就 可 以 在 应 用 中 创建 配置 并 使 用 一 种 相对 简单 的 方式 来 使 用 它 。 脚 本 的 核心 逻辑 很 
精简 。 如 果 使 用 关键 字 参 数 ， 可 以 使 实现 更 灵活 。 
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def make config( **kw ): 





config= types.SimpleNamespace () 

# set the default values 

config.some option = kw.get ("some option", default value) 
return config 


这 样 我 们 就 可 以 创建 如 下 代码 所 示 的 配置 。 


config= make config( some option= another value ) 
































simulate c( config ) 
以 上 的 实现 更 简洁 ， 并 且 和 之 前 例子 的 逻辑 一 样 清晰 。 


所 有 关于 第 1 章 ”_init_(0) 方 法 ”中 介绍 的 技术 ， 都 应 用 在 这 类 工厂 函数 配置 的 定义 中 了 。 
如 果 需 要 , 可 以 使 它 的 实现 具有 很 高 灵活 性 。 它 的 优势 是 可 以 和 解析 命令 行 的 argparse 模块 很 好 
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地 结合 。 我 们 会 在 第 16 章 “ 使 用 命令 行 ”中 对 这 部 分 进行 展开 。 


13.5.3 ”在 配置 中 使 用 Python 的 exec() 


当 决 定 使 用 Python 作为 配置 格式 时 ， 可 以 在 一 个 指定 的 命名 空间 中 使 用 exec () 函数 来 执行 
一 段 代 码 。 假 设 写 了 一 个 如 下 所 示 的 配置 文件 。 










































































# SomeStrategy setup 


# Table 

dealer rule= Hit17() 

split rule= NoReSplitAces () 

table= Table( decks=6, limit=50, dealer=dealer rule, 
split=split rule, payout=(3,2) ) 





# Player 

player_ rule= SomeStrategy () 

betting rule= Flat() 

player= Player( play=player rule, betting=betting rule, 
rounds=100, stake=50 ) 


# Simulation 
outputfile= "p2 cl13 simulation6.dat" 
samples= 100 


以 上 所 示 的 是 一 个 避 读 性 很 好 的 配置 参数 集合 。 它 - 按 下 来 的 节 中 爱 介 绍 的 INI 文件 和 特性 文 
件 类 似 ， 可 以 执行 这 个 文件 ， 使 用 exec () 函数 创建 一 种 命名 空间 。 


with open("config.py") as py file: 
code= compile(py file.read(), 'config.py', '‘'exec') 




















config= {} 

exec( code, globals(), config ) 

simulate( config['table'], config['player'], 
config['outputfile'], config['samples']) 


在 上 例 中 ， 显 式 地 使 用 compile () 函数 创建 了 一 个 对 象 。 这 是 不 必要 的 ， 可 以 只 是 简单 地 将 
文件 的 文本 传 入 exec () 函数 ， 它 可 以 直接 执行 代码 。 
exec () 函数 提供 了 3 个 参数 ， 代 码 、 存 放 全 局 变量 的 字典 以 及 用 于 存放 将 要 被 创建 的 本 地 变量 
的 字典 。 代 码 块 执行 后 ， 随 着 赋值 语句 的 执行 ， 创 建 了 本 地 变量 字典 。 在 上 例 中 ， 是 config 变量 ， 
键 将 作为 变量 名 。 

接 下 来 在 程序 初始 化 过 程 中 ， 可 以 使 用 它 来 创建 对 象 。 为 simulate () 函数 传 入 所 需 的 对 象 
来 执行 模拟 过 程 。config 变量 将 获得 本 地 变量 值 ， 如 下 代码 所 示 。 


{'betting rule': < main .Flat object at 0x101828510>， 
'dealer rule': < main .Hit17 object at 0x101828410>， 
'outputfile': 'p2 cl13 simulation6.dat', 

'player': < main .Player object at Ox101828550>, 
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'player rule' 


: < main 


'samples': 100, 


'split rule': 


'table': 


然而 ， 初 始 化 必须 是 


< main 


< main 


.So 
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meStrategy object at 0x1018284d0>, 


.NoReSplitAces object at 0x101828450>， 


.Table object at Ox101828490>} 



































介绍 的 








tO 


方式 来 初始 化 config 变量 


ass AttrDict( 
def _getat 


技术 来 实现 。 下 
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个 可 写 的 字典 格式 : config['table'], config['player']。 
于 字典 格式 不 方便 ， 因 此 可 使 用 一 种 设计 模式 ， 基 于 第 3 章 “ 属 性 访问 、 特 性 和 修饰 符 ”所 
， 基 于 字典 的 键 返回 了 命名 的 特性 。 












































EL 











tr ( self, name ): 


return self.get (name, None) 


tr ( self, name, value ) : 


def _setat 
self[name]= value 
def dir ( self ): 


return list(self.keys()) 


在 使 用 这 个 类 时 ， 























仅 当 键 和 Python 变量 名 匹配 时 才 可 以 。 有 趣 的 是 ， 如 果 以 如 下 代码 所 示 的 








config= AttrDict() 


然后 ， 可 以 使 用 一 种 简单 的 
建 和 初始 化 。 这 一 小 部 分 语法 糖 在 复 
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时 性 























量 ， 那 么 这 一 切 都 可 以 使 用 exec () 函数 来 创建 。 








格式 (config.table、config.player) 来 实现 对 象 的 创 



































杂 的 应 用 中 是 有 帮助 的 。 其 中 一 种 方式 是 定义 这 样 一 个 类 。 

















class Configuration: 


然后 就 可 以 使 用 命名 的 属性 


def init 
self. 


_( self, 
_ dict .update (kw) 








config= Configuration (人 


以 上 代码 使 用 了 简洁 的 属性 



































而 这 种 




















多 配 时 代码 才 有 效 。 
结构 在 其 他 格式 中 是 支持 的 。 











wwKW. )3 


来 将 简单 的 dict 转换 为 对 象 。 





**config ) 


























名 的 方式 来 将 dict 转换 为 对 象 。 当 然 ， 仅 当 字 典 的 键 与 Python 















































而 且 ， 对 于 平面 结构 ， 它 的 使 用 是 有 限制 的 。 不 支持 峰 套 的 字典 结构 ， 



































13.6 为 什么 执行 exec () 没有 问题 





之 前 的 节 ! 
一 般 地 ，globals () 





可 通过 














如 果 有 恶意 程序 员 要 破坏 配置 文 
们 为 什么 要 浪费 时 间 来 修改 配 


么 ， 他 











讨论 了 eval () ， 需 


要 对 exec () 做 同样 的 考虑 。 
的 可 用 集合 被 严格 控制 了 。 对 os 模块 或 ”import _() 函数 的 访问 ， 




















将 它们 从 globals 中 移 除 来 代替 ，globals 提供 给 了 exec () 。 







































































件 ， 记 住 他 们 对 所 有 的 Python 源 文件 都 是 有 访问 权限 的 。 那 























置 ， 而 不 直接 去 改 代 码 ? 
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一 个 常见 的 问题 是 :“ 如 果 有 人 认为 ， 他 们 可 以 通过 配置 文件 注入 代码 进而 修改 补丁 破坏 应 用 
程序 ， 那 么 会 怎样 呢 ? ”这 个 人 只 是 在 迫使 应 用 的 其 他 部 分 更 聪明 。 避 免 使 用 Python 配置 文件 不 能 
够 阻止 恶意 程序 员 使 用 不 明智 的 方式 做 一 些 事情 。 当 然 还 有 很 多 潜在 的 缺点 ， 完 全 不 担心 exec () 
函数 就 使 用 的 话 不 会 带 来 实际 好 处 。 

在 一 些 情况 下 ， 有 必要 改变 全 局 的 结构 。 一 个 高 度 可 自 定义 的 应 用 可 能 实际 上 是 一 个 框架 ， 
而 不 是 一 个 简洁 的 、 完 整 的 应 用 。 


13. 7 ”为 默认 值 和 重 写 使 用 链 映射 


我 们 通常 会 有 一 个 配置 文件 层次 结构 。 之 前 ， 我 们 列 出 了 一 些 配 置 文件 可 以 被 安装 的 位 置 。 例 
如 ，configparser 模块 被 定义 用 于 按 顺 序 读 取 一 些 文件 ， 然 后 通过 使 用 后 面 文件 的 值 对 前 面 文 
件 的 值 进行 覆盖 实现 配置 的 集成 。 

我 们 可 以 使 用 collection .ChainMap 类 实现 元 素 默 认 值 处 理 。 有 关 这 个 类 的 一 些 背景 ， 可 
参见 第 6 章 “ 创 建 容器 和 集合 ”。 我 们 需要 将 配置 参数 保存 为 qict 实例 ， 可 使 用 exec () 直接 执行 
Python 语言 的 配置 文件 。 
使 用 这 种 方式 ， 需 要 将 配置 参数 设计 为 压 平 的 字典 值 。 包 含 了 大 量 的 复杂 配置 值 ， 它 们 来 自 多 
个 资源 的 集成 ， 这 可 能 会 给 应 用 程序 带 来 负担 。 有 关 压 平 的 命名 ， 接 下 来 会 介绍 一 种 不 错 的 方式 。 
首先 ， 基 于 标准 位 置 创 建 一 个 文件 列表 。 


from collections import ChainMap 
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import os 

config name= "config.py" 

config locations = ( 
os.path.expanduser ("~thisapp/"), # or thisapp. file ， 
"/etcn， 
os.path.expanduser ("~/"), 
os.path.curdir, 

) 


candidates = ( os.path.join(dir,config name) 





for dir in config locations ) 


config names = ( name for name in candidates if os.path.exists (name) ) 

我 们 以 一 个 目录 列表 为 开始 ， 安 装 目录 。 它 包括 一 个 系统 的 全 局 目录 、 一 个 用 户 的 home 目录 和 
当前 的 工作 目录 。 我 们 将 配置 文件 名 放 入 每 个 目录 中 ， 然 后 确认 文件 实际 是 存在 的 。 
旦 有 了 候选 文件 的 名 称 ， 可 以 通过 对 每 个 文件 折合 来 创建 ChainMap。 


config = ChainMap () 








































































































for name in config names: 

config= config.new child() 

exec (name, globals(), config) 
simulate( config.table, config.player, config.outputfile, config. 
samples) 
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每 个 文件 包含 了 新 建 一 个 空 的 可 以 使 用 本 地 变量 来 更 新 的 map，exec () 函数 会 将 文件 的 本 地 变量 
添加 到 由 new_chil1aq () 创建 的 空 的 map 中。 每 个 新 的 chilq 更 特殊 化 一 些 ， 会 覆盖 之 前 加 载 的 配置 。 

在 chainMap 中 ， 每 个 名 称 的 解析 都 是 通过 对 整个 map 的 各 个 值 进行 搜索 得 到 的 。 当 加 载 了 
两 个 配置 文件 到 chainMap 时 ， 就 得 到 了 如 下 代码 所 示 的 结构 。 


























































































































ChainMap ( 

{'player': < main .Player object at 0x10101a710>， ‘outputfile': 
'pP2_c13 simulation7a.dat', 'player rule': < main .AnotherStrategy 
object at Oxl10101aa90>}, 

{'dealer rule': < main .Hit17 object at Ox10102a9d0>, 'betting 
rule': < main .Flat object at 0x10101a090>， 'split rule': < main . 
NoReSplitAces object at Ox10102a910>, 'samples': 100, 'player rule': 
< main .SomeStrategy object at Ox10102a8d0>, 'table': < main . 
Table object at Ox10102a890>, ‘outputfile': 'p2 cl13 simulation7.dat', 
'player': < main .Player object at Ox10101a210>}, 

{让 ) 


我 们 有 一 个 maps 序列 。 第 1 个 map 中 是 最 后 定义 的 本 地 变量 ,它们 是 重 写 的 值 ; 第 2 个 map 中 有 
咏 用 的 默认 值 ， 还 有 第 3 张 空 的 map， 因 为 CchainMap 总 是 至 少 包括 一 张 空 map。 当 创建 config 
的 初始 值 时 ， 一 张 空 的 map 就 被 创建 了 。 

这 种 做 法 的 唯一 缺陷 是 初始 化 必须 使 用 字典 格式 ，config['table']，config ['player']。 
可 以 对 chainMap () 进行 扩展 ， 为 字典 项 添加 属性 访问 。 

以 下 是 一 个 chainMap 的 子 类 。 如 果 认 为 getitem() 的 字典 格式 太 笨重 就 可 以 使 用 这 个 类 。 

























































































































































































class AttrChainMap( ChainMap ) : 
def _ getattr ( self, name ): 
if name == "maps": 
return self. dict ['maps'] 


return super() .get (name, None) 


def setattr ( self, name, value ) : 
if name == "maps": 
self. dict ['maps']= value 
return 


self[name]= value 


























现在 就 可 以 使 用 config.table 来 代替 config['table'] 了 。 在 ChainMap 的 扩展 实现 中 存在 
一 个 重要 的 限制 :我 们 不 能 够 使 用 maps 作为 一 个 属性 。Maps 键 是 父 类 chainMap 中 的 第 1 级 属性 。 


13.8 使 用 JSON 或 YAML 文件 存储 配置 


可 以 使 用 JSON 或 YAML 文件 完成 配置 值 的 存储 ， 这 种 方式 相对 容易 一 些 。 语 法 相对 友好 一 
些 。 可 以 使 用 YAML 表达 各 种 各 样 的 数据 。 然 而 ， 使 用 JSON 的 话 ， 对 象 类 的 范围 较 窗 一些， 可 像 
以 下 代码 这 样 来 定义 一 个 JSON 配置 文件 。 
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"table":{ 

"dealer™s Hit17", 
"split":"NoResplitAces", 
"decks":6, 

TEMmitE 50, 

"payveout Tt 

}, 

"player":{ 
"play":"SomeStrategy", 
"betting":"Flat", 
"rounds":100, 

"stake":50 

}, 

"simulator":{ 

"samples":100, 
"outputfile":"p2 cl13 simulation.dat" 


} 




















JSON 文档 看 起 来 像 是 嵌 套 的 字典 ， 这 正 是 在 加 载 文件 时 所 创建 的 对 象 ,可 以 使 用 以 下 代码 来 
加 载 一 个 配置 文件 。 


import json 


H 

















I 





config= json.load( "config.json" ) 


























这 样 就 可 以 使 用 config['table']['dealer'] 来 查找 用 于 庄家 规则 的 类 ， 也 可 以 使 用 
['player'] ['betting'] 来 查找 玩家 特定 的 玩 牌 策略 的 类 名 。 

不 像 INI 文件 ， 可 以 像 对 待 一 个 值 序列 那样 ， 对 tuple 进行 编码 。 按 照 这 个 逻辑 ， 
config['table']['payout'] 的 值 可 以 当 作 是 两 个 元 素 的 序列 ， 并 不 必 严 格 遵 照 tuple 那样 的 处 
时 方式 。 然 而 ， 在 访问 配置 文件 时 没有 必要 一 定 要 使 用 ast.literal eval () 。 
以 下 代码 演示 了 我 们 如 何 使 用 这 个 骨 套 结构 ， 这 里 只 列 出 main nested _ dict () 函数 的 


第 1 部 分 。 
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def main nested dict( config ) : 

dealer nm= config.get ('table',{}) .get ('dealer', ‘'Hit17') 

dealer rule= {'Hit17"':Hit17(), 
'Stand1l7':Stand17()}.get (dealer nm, Hit17()) 

split nm= config.get ('table',{}) .get ('split', 'ReSplit') 

split rule= {'ReSplit':ReSplit(), 
'NoReSplit':NoReSplit (), 
'NoReSplitAces':NoReSplitAces()}.get (split nm ReSplit()) 

decks= config.get ('table',{}) .get ('decks', 6) 

limit= config.get ('table', {}) .get ('limit', 100) 

Payout= config.get('table',{}) .get ('payout', (3,2)) 

table= Table( decks=decks, limit=limit, dealer=dealer rule, 
split=split rule, payout=payout ) 
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这 与 之 前 所 演示 的 main_ini () 函数 类 似 。 如 果 使 用 configparser 与 上 一 个 版 本 的 实现 对 
比 一 下 ， 就 会 发 现 复杂 度 基 本 是 一 样 的 。 命 名 方面 相对 简单 了 一 些 ， 使 用 了 get ('table',{}). 
get ('dqecks') 来 代替 config.getint('table', 'decks')。 

最 大 的 不 同 是 加 粗 显 式 的 那 行 代 码 。JSON 格式 提供 了 正确 解码 的 整数 值 和 值 序列 。 不 必 使 用 
eval() 或 ast .literal eval() 来 对 tuple 进行 解码 。 另 一 部 分 中 , 创建 Player 和 Simulate 
对 象 的 配置 ， 和 main_ini () 的 版 本 是 类 似 的 。 


13.8.1 ”使 用 压 平 的 JSON 配置 
如 果 使 用 将 多 个 配置 文件 进行 集成 的 方式 来 完成 默认 值 的 初始 化 ， 就 不 能 同时 使 用 
ChainMap 和 巷 套 的 字典 结构 。 因 此 ,要么 对 程序 的 参数 压 平 , 要 么 对 不 同 的 参数 数据 源 进 行 合 并 。 
可 以 在 名 字 之 间 简 单 地 使 用 .操作 符 来 对 命名 进行 压 平 操作 。 下 面 所 示 的 是 一 个 压 平 后 的 JSON 文件 。 


{ 
"player.betting": "Flat", 
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"player.play": "SomeStrategy", 
"player.rounds": 100, 
"player.stake": 50, 





"table.dealer": "Hit17", 

"table.decks": 6， 

"table.limit": 50, 

"table.payout": [3, 2], 

"table.split": "NoResplitAces", 
"simulator.outputfile": "p2 cl13 simulation.dat™", 
"simulator.samples": 100 


} 


以 上 文件 的 优势 是 ， 可 以 使 用 cnainMap 计算 来 自 不 同 参数 源 的 配置 值 。 也 简化 了 对 指定 参 
数值 查找 的 语法 。 当 拿 到 一 个 配置 文件 名 列表 时 ，config_names， 可 以 像 如 下 代码 这 样 操作 。 


config = ChainMap( *[json.load(file) for file in reversed(config names)] ) 


以 上 代码 基于 一 个 反 序 的 配置 文件 名 列表 创建 了 chainMap。 为 什么 要 反 序 ?因为 所 希望 的 
列表 顺序 为 ， 特 殊 化 的 在 前 面 ， 一 般 化 的 在 后 面 。configparser 所 需要 的 列表 也 是 反 序 的 ， 而 且 
通过 将 新 项 持续 地 添加 到 列表 头 部 以 达到 持续 创建 chainMap 的 目的 ， 反 序 也 是 必需 的 。 在 这 里 ， 
只 是 简单 地 加 载 一 个 aict 列表 进入 ChainMap 中 ， 而 且 在 使 用 key 进行 搜索 时 ， 第 1 个 dict 
将 出 现在 搜索 结果 的 第 1 个 位 置 。 

可 以 使 用 一 个 类 似 这 样 的 方法 来 加 强 chainMap 的 实现 。 以 下 代码 演示 了 第 1 部 分 ， 创 建 
Table 实例 。 









































































































































































































































def main cm( config ) : 
dealer nm= config.get ('table.dealer', ‘'Hit17') 
dealer rule= {'Hit17"':Hit17(), 
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'Stand1l7':Stand17()}.get (dealer nm, Hit17()) 
split nm= config.get ('table.split', 'ReSplit') 
split rule= {'ReSplit':ReSplit(), 
'NoReSplit':NoReSplit(), 
'NoReSplitAces':NoReSplitAces()}.get (split nm ReSplit()) 
decks= int (config.get ('table.decks', 6)) 
limit= int (config.get ('table.limit', 100)) 
Payout= config.get('table.payout', (3,2)) 
table= Table( decks=decks, limit=limit, dealer=dealer rule, 


split=split rule, payout=payout ) 
































至 于 其 余部 分 , 创建 Player 和 simulate 对 象 的 配置 , 和 main ini () 版 本 的 实现 是 类 似 的 。 
使 用 configparser 将 这 个 版 本 的 实现 与 之 前 的 比较 ,可 以 看 到 复杂 度 基 本 是 相同 的 。 以 上 


















































实现 在 命名 上 相对 简单 ， 使 用 了 int (config.get('table.decks') ) 来 代替 config.getint 
('table','decks')。 


13.8.2 ”加 载 YAML 配置 


载 。 








对 为 YAML 语法 包括 了 JSON 的 语法 ， 因 此 对 于 之 前 的 示例 ， 可 以 使 用 YAML 或 者 JSON 加 
下 定义 的 是 一 个 JSON 文件 ， 使 用 的 是 蔡 套 字典 的 写法 。 
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player: 
betting: Flat 
play: SomeStrategy 
rounds: 100 


stake: 50 
table: 

dealer: Hit17 

decks: 6 

limit: 50 


ayout [3 2] 
split: NoResplitAces 
simulator: {outputfile: p2 cl1l3 simulation.dat, samples: 100} 


比 起 纯 JSON， 这 个 文件 的 语法 好 一 些 ,， 更 容易 进行 编辑 。 对 于 配置 中 大 多 数 为 字符 串 和 整数 












































的 应 用 ， 这 种 格式 有 很 多 好 处 。 加 载 过 程 和 加 载 JSON 文件 是 相同 的 。 





展 YAML。 这 里 是 一 个 YAML 文件 ， 














import yaml 
config= yaml.load( "config.yaml" ) 


和 髓 套 字 上 典 所 遇 到 的 限制 一 样 ， 需 要 对 命名 进行 压 平 来 解决 默认 值 的 问题 。 


如 果 要 支持 除 字符 串 和 整数 外 的 更 多 类 型 , 可 以 通过 对 类 名 进行 编码 并 创建 自 定义 的 实例 来 和 
j 于 创建 模拟 器 所 需 的 配置 对 象 。 























过 : 

































































As 





# Complete Simulation Settings 
table: !!Python/object: main .Table 
dealer: !!Python/obJject: main .Hit17 {} 
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decks: 6 

11mite 50 

payout: !!python/tuple [3, 2] 

split: !!python/object: main .NoReSplitAces {} 
player: !!python/object: main .Player 

betting: !!python/object: main .Flat {} 


init stake: 50 
max rounds: 100 
play: !!python/object: main .SomeStrategy {} 
rounds.: :0 
stake: 63.0 
samples: 100 
outputfile: p2 cl1l3 simulation9.dat 














我 们 对 类 名 和 实例 的 构造 器 使 用 YAML 进行 了 编码 ， 这 样 就 可 以 对 Table 和 Player 定义 
完整 的 初始 化 ， 可 以 像 以 下 这 样 使 用 初始 化 文件 。 


import yaml 














if name == " main ": 





config= yaml.load( yamll file ) 
simulate( config['table'], config['player'], 
config['outputfile'], config['samples'] ) 












































在 上 例 中 ， 可 以 看 到 YAML 配置 文件 可 以 直接 被 编辑 。YAML 格式 具备 Python 同样 的 能 力 ， 但 
需要 更 复杂 的 语法 。 对 于 上 例 来 说 ， 使 用 Python 配置 脚本 比 YAML 更 好 一 些 。 


13.9 ”使 用 特性 文件 存储 配置 


特性 文件 通常 在 Java 程序 中 使 用 。 在 Python 中 一 样 可 以 使 用 它们 。 它 们 解析 起 来 更 容易 ， 
并 且 可 以 使 用 方便 的 容易 掌握 的 格式 来 对 配置 参数 进行 编码 。 有 关 这 种 格式 的 更 多 信息 ， 可 参见 : 
http://en.wikipedia.org/wiki/.properties。 如 下 是 一 个 特性 文件 的 示例 。 
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# Example Simulation Setup 


player.betting: Flat 
player.play: SomeStrategy 
player.rounds: 100 
player.stake: 50 


table.dealer: Hit17 
table.decks: 6 
table.1limit: 50 
table.payout: (3,2) 
table.split: NoResplitAces 


simulator.outputfile = p2 cl3 simulation8.dat 
simulator.samples = 100 
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以 上 文件 的 语法 更 简洁 ， 这 是 它 的 一 个 优势 。section .property 这 样 的 命名 很 常见 。 在 一 











让 





个 复杂 的 配置 文件 中 ， 它 的 名 字 会 很 长 。 


13.9.1 解析 特性 文件 









































































































































在 Python 标准 库 中 ， 没 有 内 置 的 特性 解析 器 。 可 以 从 Python 的 包 管理 系统 中 下 载 一 个 特性 文 
件 解 析 器 (https://pypi.python.org/pypi)。 然 而 ， 它 不 是 一 个 复杂 的 类 ， 在 高 级 面向 对 象 编程 中 它 是 
一 个 不 错 的 实践 。 

我 们 将 这 个 类 分 为 最 外 层 的 API 函数 和 较为 底层 解析 函数 。 这 里 是 一 些 全 局 的 API 方法 。 


import re 

class PropertyParser: 
def read string( self, data ): 
return self. parse (data) 

read filel( self, file ): 

data= file.read() 

return self.read string( data ) 
self, 
with open (filename) 


def 


def readl( filename ): 


as file: 


return self.read file( file ) 


以 上 实现 的 功能 是 对 文件 名 、 文 件 或 是 一 个 文本 块 进行 解析 。 它 沿用 
格 。 一 种 常见 的 方式 (更 少 的 使 用 方法 ) 是 使 用 isinstance () 来 决定 参数 类 型 
文件 名 是 串 类 文件 通常 是 io .TextIOBase 的 实例 。 文 本 块 也 是 
点 ， 许 多 库 使 用 
方式 和 json 模块 是 一 致 的 。 


load( self, 
if isinstance (file or name, io.TextIOBase): 
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def file or name ) : 
self.loads (file or name.read()) 
else: 
with open(filename) as file: 
self.loads (file.read()) 
def loads( self, string ) : 
return self. parse (data) 








xzr Ar CH 


子 付 中 ， 
Load () 来 加 载 文 件 和 文件 名 ， 使 用 loaqs () 来 加 载 简单 的 字符 串 。 以 下 这 种 设计 


了 configparser 的 设计 风 


以 及 处 理 罗 辑 。 
基于 这 一 











这 些 方法 同样 支持 文件 、 文 件 名 或 文本 块 。 这 些 附 加 的 方法 名 提供 了 一 个 API， 使 用 起 来 更 简 























便 。 重 要 的 是 ， 在 不 同 的 库 、 包 和 模块 中 ， 需 要 进 
key element pat= re.compilel(r" 
self, data ): 
logical lines (line.strip() 

for line in re.subl(r"\\\n\s*", data) .splitlines ()) 
non empty= (line for line in logical lines 

if len(line) != 0) 
(line for line in non empty 
line.startswith("#") or line.startswith("!") ) ) 








on) Ns (aINN) [SsNslNSsr (x*)") 
def parsel( 


mn 
7 


non comment= 
IE" Ot:( 





行 一 致 性 的 设计 。 以 下 是 _parse () 方法 的 实现 。 
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for line in non comment : 
ke match= self.key _ element pat.match (line) 
if ke match: 
key, element = ke match.group(1), ke match.group (2) 
else: 
key, element = line, "" 
key= self. escape (key) 
element= self. escape (element) 
yield key, element 


这 个 方法 使 用 了 3 个 表达 式 生成 器 ， 用 于 对 特性 文件 中 的 物理 行 和 轩 辑 行 提供 一 些 全 局 功能 
表达 式 生 成 器 分 为 3 种 语法 规则 。 支 持 延 迟 执 行 是 它 的 一 个 优势 。 在 for line in non_comment 
语句 执行 之 前 ， 表 达 式 生成 器 不 会 产生 任何 的 中 间 结 

对 于 第 1 个 表达 式 ， 赋 值 给 了 logical_ lines 变量 ， 对 以 \ 为 结尾 的 物理 行进 行 合并 ， 来 创建 更 
长 的 逻辑 行 。 开 头 〈 和 结尾 ) 的 空格 被 移 除了 ， 只 留 下 了 行内 容 。 正 则 表达 式 r"Wn\s*" 用 于 匹配 所 
有 以 \ 为 结尾 的 当前 行 以 及 所 有 开头 是 空格 的 下 一 行 。 

第 2 个 表达 式 赋值 给 了 non_empty， 只 会 对 长 度 大 于 0 的 行进 行 迭 代 。 它 会 过 滤 掉 空白 行 。 

第 3 个 表达 式 ，non_comment 只 会 对 没有 以 # 或 ! 开 头 的 行进 行 迭 代 ， 以 # 或 ! 为 开头 的 行 会 被 
过 滤 掉 。 

使 用 了 这 3 种 表达 式 生 成 器 ，for line in non_comment 循环 只 会 对 没有 注释 的 、 非 空 的 、 
移 除了 空格 的 逻辑 在 循环 体 中 ， 在 剩余 的 行 中 取出 一 部 分 ， 将 键 和 值 分 离 ， 然 后 执行 
self._escape () 函数 来 对 转 义 序列 进行 扩展 。 

es key_element_pat 会 查找 没有 转 义 的 : , = 或 者 是 周围 都 是 空白 的 空格 。 它 使 用 
断言 进行 了 封装 ， 使 用 (?<!\\) 来 表示 正则 表达 式 必 须 是 没有 被 转 义 的 ， 之 后 的 模式 都 不 能 以 \ 
开头 。 这 意味 着 (?<!N\) [:=\s] 是 没有 被 转 义 的 : ， 或 =， 或 者 空格 。 
如 果 键 值 对 模式 没有 匹配 到 任何 结果 ， 就 意味 着 缺少 分 隔 符 。 我 们 将 这 种 情况 视 为 没有 提供 与 
相关 键 匹 配 的 值 。 
习 为 键 值 构成 了 两 个 元 素 的 元 组 ， 它 可 以 被 转换 为 字典 ， 它 提供 了 一 个 配置 的 映射 表 ， 就 像 之 
条 所 看 到 的 一 些 配 置 表示 模型 一 样 。 它 也 可 以 作为 一 个 序列 来 展示 排序 好 的 原文 件 的 内 容 。 最 后 的 
分 是 一 个 方法 ， 用 于 将 转 义 符 转 换 为 最 终 字 符 。 

def _escape( self, data ) : 
dl= re.sub( r"\\([:#!=\s])", lambda x:x.group(1), data ) 
d2= re.sub( r"\\u([0-9A-Fa-f]+)", lambda x:chr (int (x. 
group(1),16)), dl ) 
return d2 
_escape () 方法 函数 执行 了 两 次 替换 。 第 1 次 将 转 义 的 标点 符号 以 纯 文 本 的 格式 替代 ， 将 \:， 
\#,\!, \= 的 \ 移 除 ,。 对 于 Unicode 转 义 符 , 进 制 字符 串 用 于 创建 正确 的 Unicode 字符 , 替换 掉 \uxxxx 
序列 。 将 十 六 进 制 的 数 转换 为 整数 ， 进 行 了 字符 蔡 换 。 
为 了 消除 中 间 变 量 , 两 次 蔡 换 可 以 被 合并 为 一 次 操作 , 这 样 可 以 提高 性 能 。 合并 后 的 代码 如 下 。 
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d2= re.sub( r"\\([:#!=\s]) |\\u([0-9A-Fa-f]+)", 


lambda x:x.group(1) if x.group(1) else chr(int (x. 


group(2),16)), data ) 


而 这 一 小 部 分 的 性 能 优化 与 复杂 的 正则 表达 式 以 及 























13.9.2 ”使 用 特性 文件 


在 使 ) 













































































里 过 程 相对 简单 ， 








并 提供 了 所 需 的 功能 。 











config= ChainMap ( 


我 





的 放 最 后 面 ,。 一 旦 完成 了 chainMap 的 加 载 ,就 可 以 使 / 


实例 的 创建 和 初始 化 。 
比 起 要 为 一 种 包含 了 多 个 数据 源 的 映射 做 更 新 ， 这 种 方式 似乎 更 容易 一 些 。 它 沿用 了 用 于 处 理 


*[dict( pp.read (file) ) 


for file in reversed(candidate list)] ) 


ChainMap 模式 为 每 个 配置 文件 创建 4 


换 函 数 所 带 来 的 开销 互相 抵消 了 。 








特性 文件 时 ,， 有 两 种 选择 。 可 以 使 用 configparser 的 设计 方式 对 多 个 文件 进行 解析 ， 

然后 基于 不 同 值 的 合并 结果 创建 一 种 映射 。 或 者 使 用 

的 映射 。 
ChainMap 处 














竺 性 序列 








门将 文件 列表 顺序 翻转 了 : 包含 最 特殊 化 设置 的 放 在 列表 








第 1 个 位 置 ， 





















































JSON 和 YAML 配置 文件 的 方式 。 














J 含 最 一 般 化 配置 


特性 来 完成 Player、Table 和 Simulate 





































































































还 可 以 使 用 这 样 的 方式 来 对 chainMap 进行 扩展 ， 与 之 前 看 到 的 main_cm() 函数 类 似 。 这 里 
是 代码 的 第 1 部 分 ， 创 建 Table 实例 。 
import ast 
def main cm str( config ): 
dealer nm= config.get ('table.dealer', ‘'Hit17') 
dealer rule= {'Hit17"':Hit17(), 
'Stand1l7':Stand17()}.get (dealer nm, Hit17()) 
split nm= config.get ('table.split', 'ReSplit') 
split rule= {'ReSplit':ReSplit(), 
'NoReSplit':NoReSplit (), 
'NoReSplitAces':NoReSplitAces()}.get (split nm ReSplit()) 
decks= int (config.get ('table.decks', 6)) 
limit= int (config.get ('table.limit', 100)) 
payout= ast.literal eval (config.get('table.payout', '(3,2)')) 
table= Table( decks=decks, limit=limit, dealer=dealer rule, 
split=split rule, payout=payout ) 
与 main_cm() 函数 实现 的 不 同 点 在 于 payout 元 组 的 处 理 。 在 之 前 的 实现 里 ，JSON (和 
YAML) 可 以 解析 元 组 。 当 使 用 特性 文件 时 ， 所 有 的 值 都 是 简单 的 字符 串 。 必 须 使 用 eval () 或 





























ast .literal eval() 来 执行 传 入 的 值 ,main cm str() 函数 的 其 余部 分 与 mai 


同 的 。 








n_cm() 函数 是 相 


Im 中 
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13. 10 ”使 用 XML 文件 一 一 PLIST 以 及 其 他 格式 保存 配置 


正如 在 第 9 章 “ 序 列 化 和 保存 一 一 JSON、YAML、Pickle、CSV 和 XML” 中 所 看 到 的 ，Python 
的 xml 包 中 提供 了 多 个 用 于 解析 XML 文件 模块 由 于 XML 文件 使 用 的 普遍 性 ,在 XML 文档 与 Python 
对 象 间 的 转换 通常 是 必要 的 。 不 像 JSON 和 YAML，XML 的 转换 不 是 那么 容易 。 

一 种 常见 的 方式 是 使 用 XML 将 配置 数据 表示 在 .plist 文件 中 。 更 多 有 关 .plist 格式 的 信息 ， 参 
见 http://developer.apple.com/documentation/Darwin/Reference/ManPages/ manS/plist.5.html。 
苹果 用 户 可 以 使 用 man plist 命令 来 查看 这 个 页 面 。.plist 格式 的 优势 是 它 使 用 了 一 些 非 
常 一 般 化 的 标签 ， 这 使 得 .plist 文件 的 创建 和 解析 很 容易 。 以 下 的 例子 中 包含 了 配置 参数 
的 .plist 文件 。 
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<?xml version="1.0" encoding="UTF-8"?> 
<!DOCTYPE plist PUBLIC "-//Apple//DTD PLIST 1.0//EN" "http://www. 
apple.com/DTDs/PropertyList-1.0.dtd"> 
<plist version="1.0"> 
<dict> 
<key>player</key> 
<dict> 
<key>betting</key> 
<string>Flat</string> 
<key>play</key> 
<string>SomeStrategy</string> 











<key>rounds</key> 
<integer>100</integer> 
<key>stake</key> 
<integer>50</integer> 

</dict> 

<key>simulator</key> 

<dict> 
<key>outputfile</key> 
<string>p2 c13 simulation8.dat</string> 
<key>samples</key> 
<integer>100</integer> 

</dict> 

<key>table</key> 

<dict> 
<key>dealer</key> 
<string>Hit17</string> 
<key>decks</key> 
<integer>6</integer> 
<key>limit</key> 
<integer>50</integer> 
<key>payout</key> 
<array> 

<integer>3</integer> 
<integer>2</integer> 
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</array> 
<key>split</key> 
<string>NoResplitAces</string> 
/CH 
</dict> 
</plist> 


























在 这 个 例子 中 ， 演 示 了 扔 套 的 字典 结构 ， 有 很 多 与 Python 类 型 兼容 的 XML 标签 。 


























Python 类 型 Plist 标签 

str <string> 

float <real> 

int <integer> 
datetime <date> 

boolean <true/> 或 <false/> 
bytes <data> 

list <array> 

dict <dict> 















































正如 在 之 前 的 例子 中 ，<key> 的 值 是 字符 串 。 这 样 就 为 模拟 器 应 用 提供 了 编码 良好 的 plist， 





















































包含 了 配置 参数 。 可 使 用 相对 容易 的 方式 来 加 载 一 个 .plist。 


import plistlib 
print( plistlib.readPlist (plist file) ) 























这 将 重 构 配置 参数 .然后 可 以 使 用 之 前 在 介绍 JSON 配置 文件 的 节 中 提 到 的 main nesteqd_qdict () 
函数 来 操作 这 个 骨 套 的 字典 。 
当 使 用 单一 模块 函数 来 解析 文件 时 ，.plist 格式 显得 非常 好 用 。 与 JSON 或 特性 文件 一 样 ， 
缺少 对 Python 自 定义 类 的 支持 。 


自 定义 XML 配置 文件 


有 关 更 复杂 的 XML 配置 文件 ， 可 以 参见 http://wiki.metawerx.net/wiki/Web.xml。 这 个 文件 ! 











































































































同时 包含 了 特殊 标签 和 一 般 标签 ， 这 些 文档 解析 起 来 很 困难 ， 这 里 有 两 种 常见 的 方式 。 
e@ 。 写 一 个 文档 处 理 类 ， 使 用 XPath， 根据 数据 完成 对 标签 的 查询 。 这 样 的 话 ， 就 需要 写 特 性 
(或 方法 ) 进行 查询 XML 结构 中 所 需要 的 信息 。 
@ ”将 XML 文档 转换 为 一 个 Python 的 数据 结构 ， 这 种 方式 和 之 前 看 到 的 plist 模块 是 一 致 的。 
基于 Web.xml 文件 的 例子 ， 在 配置 模拟 器 应 用 时 ， 可 以 设计 自 定义 的 XML 文档 。 


<?xml version="1.0" encoding="UTF-8"?> 
<simulation> 
<table> 
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<dealer>Hit17</dealer> 
<split>NoResplitAces</split> 
<decks>6</decks> 
<limit>50</1limit> 
<payout> (3,2)</payout> 

</table> 

<player> 
<betting>Flat</betting> 
<play>SomeStrategy</play> 
<rounds>100</rounds> 
<stake>50</stake> 

</player> 

<simulator> 
<outputfile>p2 c13 simulation1ll1.dat</outputfile> 
<samples>100</samples> 

</simulator> 


</simulation> 














这 是 一 个 特殊 化 的 XML 文件 。 我 们 没有 提供 DTD 或 XSD， 因 此 没有 使 用 根据 模型 来 验证 
XML 的 方式 。 然 而 ， 这 个 文件 非常 小 ， 很 容易 调试 ， 并 且 初 始 化 过 程 与 之 前 例子 中 提 到 的 类 似 。 
这 里 是 一 个 Configuration 类 ， 使 用 XPath 查询 来 从 文件 中 获取 信息 。 


+ 





T 

































































import Xml .etree.ElementTr as XML 





class Configuration: 
def read file( self, file ): 
self.config= XML.parse( file ) 
def readq( self, filename ) : 
self.config= XML.parse( filename ) 
def read string( self, text ): 





self.config= XML.fromstring( text ) 
def get( self, qual name, default ) : 
section, , item = qual name.partition(".") 
query= "./{0}/{1}".format( section, item ) 
node= self.config.find(query) 
if node is None: return default 
return node.text 
def getitem ( self, section ) : 
query= "./{0}".format (section) 
parent= self.config.find(query) 
return dict( (item.tag, item.text) for item in parent ) 








我 们 实现 了 3 种 方法 来 加 载 XML 文档 : read ()、reagd file() 和 read string ()。 它 们 都 是 
对 xml .etree.ElementTree 类 中 方法 的 代理 实现 ， 这 与 configparser API 是 一 致 的 。 我 们 也 会 使 
用 1oad() 和 1oads () ， 因 为 它们 也 是 相应 的 对 Parse () 和 fromstring () 的 代理 实现 。 

至 于 配置 数据 的 访问 ， 我 们 实现 了 两 种 方法 : get () 和 getitem  () 。 可 以 像 这 样 来 使 用 
get () 方 法: stake= int (config.get('player.stake'，50) ) 以 及 像 这 样 来 使 用 _getitem  () 
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方法 : stake= config['player']['stake']。 





解析 过 程 比 .plist 文件 稍微 复杂 些 。 然 而 ，XML 比 相同 
在 之 前 的 节 中 所 介绍 的 main_cm_str () 函数 来 完成 配置 的 处 理 过 程 。 























可 以 对 特性 文件 使 ) 
13. 11 ”总结 


























内 容 的 .plist 格式 相对 简单 。 



































我 们 介绍 了 很 多 用 于 表示 配置 参数 的 方法 。 它们 的 大 多 数 都 基于 在 第 9 章 “ 序 列 化 和 保存 一 一 
JSON、YAML、Pickle、CSV 和 XML” 中 介绍 的 序列 化 技术 。configparser 模块 提供 了 另外 一 


种 格式 ， 





















































为 一 些 用 户 提供 了 方便 。 


























13.11.1 设计 要 素 和 折 中 方案 

















中 。 可 以 将 这 些 文 


配置 文件 可 以 简化 应 用 程序 的 运行 和 服务 器 的 启动 , 可 以 将 所 有 相关 参数 放 在 容易 读 写 的 文件 














对 于 配置 文件 来 说 ， 关 键 功能 是 内 容 可 以 被 很 容易 地 编辑 。 基 于 这 个 原因 ，pickle 文件 并 不 是 
推荐 的 格式 。 





















































牛 放 在 配置 的 控制 范围 内 ， 追 踪 修 改 历史 记录 ， 并 使 用 它们 来 提高 软件 质量 。 




















在 使 用 这 些 文件 时 ,在 格式 上 有 一 些 选 择 ， 它 们 编辑 起 来 都 很 容易 ， 但 在 解析 的 难 易 程度 上 以 
及 对 Python 数据 编码 的 限制 上 ， 它 们 是 不 同 的 。 


在 多 种 应 用 或 服务 器 共存 的 环境 中 ， 需 要 选择 一 个 更 好 的 配置 文件 格式 。 如 果 有 其 他 的 应 用 使 









































Dr 





INI 文件 这 些 文件 解析 起 来 很 容易 并 且 只 限制 使 
4 了 Python 代码 (PY 文件 ): 这 些 文件 在 配置 中 使 用 









































用 字符 串 和 数字 。 


WE 


却 本 。 不 需要 解析 ， 类 型 没有 限制 。 























它们 使 用 一 个 exec () 文件 ， 它 解析 起 来 很 容易 并 且 类 型 没有 限制 。 








JSON 或 YAML 文件 : 这 些 文件 解析 起 来 很 容易 。 它 
YAML 可 以 对 Python 进行 编码 ， 但 为 什么 不 直接 使 用 
特性 文件 ， 这些 文 件 需 要 特殊 的 解析 器 。 
XML 文件 : 

















2 



































门 支持 字符 串 、 数 字 、 字 典 和 集合 。 
Python ? 





能 使 用 字符 串 。 























4 .plist 文件 : 这 些 文件 解析 起 来 很 容易 。 它 们 支持 字符 串 、 数 字 、 字 典 和 集合 。 


4 ， 自 定义 的 XML: 这 些 文件 需要 特殊 的 解析 器 。 它 









































们 只 能 使 用 字符 串 。 



























































用 了 .plist 或 INI 文件 ， 就 需要 做 出 选择 : 哪 种 格式 使 用 起 来 更 容易 。 


从 对 象 可 以 被 表示 的 广度 来 看 ， 配 置 文件 可 以 被 分 为 4 类 。 



























































只 有 字符 串 的 简单 文件 : 自 定 义 XML， 特 性 文件 。 
简单 的 Python 文本 的 简单 文件 ，INI 文件。 





































































































使 用 YAML。 





支持 Python 文本 、 和 集合 以 及 字典 的 更 复杂 的 文件 : JSON、YAML、.plist 和 XML。 
一 切 和 Python 相关 的 : 可 以 使 用 YAML， 但 当 Python 具备 了 更 清晰 的 语法 时 ， 不 必要 再 


























13.11.2 


在 第 
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创建 共享 配置 
17 章 “ 模 块 和 包 的 设计 ”中 ， 会 介绍 一 些 有 关 模 块 设计 需要 考虑 的 点 以 及 什么 样 的 模块 






































适合 使 用 单 例 设计 模式 。 意 味 着 只 需要 导入 模块 一 次 ， 实 例 是 共享 的 。 

























































































































































































正 是 因为 这 一 点 ， 需 要 将 配置 定义 在 一 个 单独 的 模块 中 ， 然 后 进行 导入 。 这 样 就 可 以 在 不 同 的 
模块 间 共享 一 个 公共 的 配置 。 在 每 个 模块 中 导入 共享 的 配置 模块 配置 模块 用 于 查找 配置 文件 然后 
创建 配置 对 象 
13.11.3 模式 演化 




















配置 文件 是 面向 公共 API 的 一 部 分 。 在 设计 应 用 时 ， 需 要 解决 模式 演化 的 问题 。 当 修改 一 个 类 
定义 时 ， 如 何 修改 配置 ? 
























































于 配置 文件 
当 软 件 的 主 版 本 更 新 时 一 一 在 API 或 数据 库 模 型 发 生变 化 时 一 一 配置 文件 也 可 能 需要 做 很 大 
的 改动 。 为 了 区 分 新 旧版 本 的 配置 人 参数， 配置 文件 的 版 本 号 也 需要 改 。 
当 版 本 发 生 大 改动 时 ， 配 置 文件 〈 例 如 数据 库 、 输 入 和 输出 文件 和 API) 需要 考虑 兼容 性 。 
在 处 理 配 置 参数 的 默认 值 时 ， 需 要 考虑 到 主 版 本 的 改动 。 











包含 了 默认 值 ， 它 们 通常 带 来 了 灵活 性 。 从 原则 上 来 说 ， 它 们 完全 是 可 选 的 。 




















































































































对 应 用 程序 来 说 ， 配 置 文件 是 第 1 级 输入 。 没 有 任何 一 种 可 以 经 过 深思 熟 虑 的 可 替代 方案 。 像 
其 他 的 输入 输出 一 样 ， 它 需要 经 过 仔细 的 设计 。 当 我 们 看 第 14 章 “Logging 和 Warning 模块 ”以 















































6 




















及 第 16 壮 


13.11.4 


在 之 
块 ” 中， ， 




















使 用 命令 行 ” 时 ， 会 对 如 何 解析 配置 文件 的 基础 部 分 进行 展开 介绍 。 


展望 
后 的 几 章 中， 我 们 将 会 介绍 有 关 高 扩展 性 的 设计 要 素 。 在 第 14 章 “Logging 和 Warning 模 
各 介绍 如 何 使 用 logging 和 warnings 模块 来 完成 审计 信息 的 创建 和 调试 。 在 第 15 章 

































































“可 测试 怕 




















全 








的 设计 ”中 ， 会 介绍 有 关 可 测试 性 的 设计 ， 以 及 如 何 使 用 unittest 和 aqoctest。 在 




















第 16 章 “ 使 用 命令 行 ”中 ， 会 介绍 如 何 使 用 argparse 模块 来 完成 选项 和 参数 的 解析 ， 进 一 步 使 











用 命令 设计 模式 创建 程序 组 件 ， 这 样 一 来 ， 在 无 需 修改 shell 脚本 的 前 提 下 就 可 以 完成 组 件 的 扩展 





性 和 可 结合 性 。 在 第 17 章 “ 模 块 和 包 的 设计 ”中 ， 将 会 介绍 有 关 模 块 和 包 的 设计 。 在 第 18 章 “ 质 量 
































和 文档 ”， 




















， 会 介绍 如 何 创建 设计 说 明文 档 ， 它 能 够 诠释 软件 功能 的 正确 性 和 可 靠 性 。 











第 3 部 分 





测试 、 调 试 、 部 署 和 维护 


Logging 和 Warning 模块 


可 测试 性 的 设计 

















使 用 命令 行 





模块 和 包 的 设计 


质量 和 文档 





在 进行 Python 应 | 

















为 





@ ”我 们 会 介绍 到 可 涡 
和 doctest。 自 
那么 不 能 认为 软 伯 





不 





日记 
下 

















纯 








第 
审计 和 调 
提供 了 4 



































测试 、 调 试 、 部 署 和 维护 




















的 编程 ， 





程序 开发 时 ， 会 涉及 一 
还 需要 关注 如 何 解 决 
14 章 “Logging 和 Warning 模块 ”会 介绍 如 何 使 用 Logging 和 Warning 模块 来 创建 

















试 信息 。 








不 单 
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C 





除 面 向 对 象 设计 之 外 的 技巧 。 接 下 来 会 关注 一 些 


C 





























使 用 Print ( 








民 多 功能 ， 可 以 使 ) 

















已 是 高 度 











可 配置 的 ， 











可 用 


























动 











命令 行 接 
时 间 运 行 
命令 行 ” 


序 的 扩展 





妆 


高 层 






































为 程序 ] 
的 服务 。 然 而 ， 


会 介绍 如 




















Command 设计 模式 来 构建 程 


o 


看 上 的 设计 。 模 块 和 类 一 些 设计 到 
包 与 模块 的 结构 ， 而 不 会 涉及 有 具体 的 数 
第 18 章 “ 质 

这 部 分 会 介绍 几 种 使 | 
风格 的 类 ”以 及 第 2 间 

































































| 简单 的 、 统 一 
生成 详细 的 
1 试 性 的 设计 并 在 第 15 章 “ 可 测试 性 的 设计 ” 
比 测试 应 该 被 认为 是 必要 的 。 如 果 自 动 化 测 
已 经 完成 。 


提供 了 更 多 的 选项 和 参数 。 通 常 应 用 于 小 型 





j 户 的 问题 : 














) 函数 ， 还 会 有 额外 的 一 些 操作 。Logging 模块 
的 接口 生成 审计 、 调 试 信息 以 及 文本 消息 。 由 于 
周斌 信息 或 者 使 用 相关 选项 来 完成 。 
会 介绍 如 何 使 用 unittest 
试 不 能 说 明代 码 是 有 效 的 ， 













































































的 、 基 于 文本 的 程序 以 及 长 














即使 是 GUI 应 





何 使 月 


























量 和 文档 ”会 介绍 如 何 写 设计 文档 ， 说 明 软 
额外 模块 来 提高 软件 质量 的 方法 。 不 像 第 1 部 分 “用 特殊 方法 实现 
了 分 “持久 化 和 序列 化 ”这 样 
某 种 特殊 的 问题 。 这 些 主题 有 助 于 从 整体 上 理解 熟练 掌握 Python 再 


argparse 模块 来 完成 选项 和 参数 的 解析 。 我 们 会 进一步 使 用 
章 , 用 于 完成 在 无 需 对 Shell 脚本 进行 重 排序 的 前 提 下 进行 程 


























也 可 以 使 ) 








命令 行 选项 来 配置 。 第 16 章 “ 使 用 






































第 17 章 “ 模 块 和 包 的 设计 ”会 介绍 如 何 设计 模块 和 包 。 比 起 之 前 介绍 的 类 设计 ， 这 是 更 
念 是 共同 的 : 包 玩 、 扩 展 和 创造 。 会 介绍 模块 与 类 、 

















或 操作 。 





全 的 可 靠 性 以 及 如 何 被 构建 的 。 

































































Python 
的 主题 ， 这 里 要 介绍 的 工具 将 不 仅 局 限于 只 是 解 
向 对 象 的 编程 思想 。 
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日 
件 
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PE 





有 一 些 
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我 们 经 














常会 遇 到 需要 记录 多 个 包含 不 同 种 


币 候 过 


第 14 章 


Logging 和 Warning 模块 











本 的 日 志 记 录 技 术 既 可 以 在 调试 
































中 使 用 也 可 以 为 应 上 
日 志 可 以 帮 我 们 证 明 应 用 程序 符合 安全 性 和 审计 的 要 求 。 
























































类 信息 的 日 志 情 









































况 。 我 们 可 


程序 提供 运行 支持 。 特 别 地 ， 好 





能 会 将 安全 、 审 计 和 调试 








志 分 别 记录 到 不 同 的 日 志文 件 中 。 在 一 些 情 况 下 ， 我 们 可 能 希望 把 所 有 信息 都 记录 到 一 个 日 志文 


中 。 本 章 会 介绍 一 些 需 要 这 样 做 的 例子 。 


























为 了 确 


定 程序 是 正常 工作 的 ， 用 户 可 能 想 要 看 到 见长 的 输 














有 户 关 注 的 是 程序 是 如 何 解决 他 们 的 问题 的 。 例 
不 同 级 别 信息 的 日 
的 信息 。 对 了 开发 者 而 言 ， 我 


时 。 设 定 信息 级 别 能 够 根据 用 户 的 需要 生成 包含 
warnings 模块 能 为 开发 者 和 用 户 提供 有 用 














格 来 说 ， 它 3 
当 软 件 维 


含 所 有 信息 的 调试 信息 : 产生 站 
问题 的 那 部 分 调试 信息 ， 这 样 就 可 以 修改 单元 测试 用 例 并 且 修 复 软 
当 尝试 解决 程序 骨 溃 的 问题 时 ， 可 能 需要 






























































1。 这 些 输出 和 调试 的 输出 信息 不 同 ， 最 终 


9， 他 们 可 能 会 改变 输入 或 者 用 不 同 的 方法 处 理 程序 的 输 


































































































EE 


Mo 


来 通知 你 某 个 API 已 经 不 再 维护 了 。 对 于 用 户 而 言 ， 可 能 希望 向 你 说 明 











门 可 能 会 用 warnings 





虽然 结果 有 问题 ， 但 是 严 


























不 是 错误 的 。 一 些 有 问题 的 假设 或 者 令 人 迷惑 的 默认 值 需要 向 





护 工程 师 想 要 收集 一 些 有 用 的 调 








Ll 








试 信息 时 ,需要 启用 日 志 。 我 人 





日 志文 件 可 能 根本 无 法 阅读 。 通 常 ， 








































































































创建 一 个 用 于 





No 














能 也 可 以 利用 这 个 队列 找到 问题 ， 而 不 用 筛选 


创建 基本 日 志 


14. 1 
创建 日 
@ 通 














有 两 个 必要 的 步骤。 

















得 

















@ ”用 获得 的 Logger 创建 消息 。 有 许多 | 
info()、debug()、error() 和 fatal()。 
但 是 ， 这 两 个 步骤 不 足以 给 我 们 提供 任何 输 


















































S 











志 是 为 调试 准备 的 ， 所 以 我 们 3 




















户 提前 指出 














门 很 少 会 有 情况 需要 包 


























我 们 只 需要 用 于 追踪 某 个 特定 


件 。 
捕获 最 后 几 个 事 
巨大 的 日 志文 件 。 





过 logging.getLogger () 函数 获得 1ogging .Logger 实例 。 
于 创建 不 同 重要 性 


出 。 只 有 当 我 们 需要 查看 输出 的 时 候 ， 才 会 使 用 第 3 个 





件 的 循环 队列 。 我 们 可 





E 级 别 消息 的 方法 , 例如 warn () 、 














不 总 是 希望 看 到 这 种 日 





























个 可 选 的 步骤 是 配置 





logging 模块 的 handlers、filters 和 formatters， 可 以 用 logging .basicConfig () 函数 完成 这 些 配 置 。 


器 。 在 第 8 章 “ 装 饰 器 和 mixin 
注 的 有 
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就 技术 上 而 言 ， 甚 至 可 能 可 以 跳 过 第 1 步 。 我 们 可 以 用 logging 模块 顶层 函数 默认 的 日 志 记录 
横 切 方面 ” 中， 介绍 过 这 种 日 志 记录 器 ， 但 是 由 于 当时 主要 关 
是 装饰 而 不 是 日 志 ， 因 此 没有 深入 讲解 它 。 建 议 你 不 要 使 用 默认 的 根 记 录 器 。 为 了 弄 清楚 为 什 































































































么 最 好 不 要 使 用 根 记 录 器 ， 我 们 需要 先 介绍 一 点 背景 知识 。 


器 的 名 称 是 “” 








Logger 的 实例 是 通过 名 称 标识 的 。 名 称 中 用 “.-” 分 别 的 字符 串 组 成 了 一 个 层次 结构 。 根 记录 
空 字符 串 。 所 有 其 他 的 Loggers 都 是 这 个 根 Logger 的 孩子 。 
于 这 棵 树 的 名 称 是 Loggers， 因 此 我 们 通常 会 用 根 Logger 来 配置 整 棵 树 。 当 找 不 到 正确 的 










































































Logger 时 , 我 们 也 会 使 用 它 。 如果 把 根 Logger 也 作为 某 个 模块 的 一 等 日 志 , 那么 只 会 制造 混乱 。 


Filters 列 








日 






































除了 名 称 之 外 ， 可 以 在 Handlers 列表 中 配置 Logger 确定 要 将 消息 写 到 哪里 ， 也 可 以 在 
配置 Logger 确定 哪 种 消息 可 以 通过 以 及 需要 拒绝 哪 种 消息 。 日 志 记 录 器 是 记录 












































































































































志 的 基本 API: 我 们 用 日 志 记录 器 创建 LogRecords。 然 后 ， 这 些 记录 会 被 发 送 给 Filters 和 
































Handlers， 之 后 ， 被 接受 的 记录 会 被 格式 化 并 保存 在 本 地 文件 中 或 者 通过 网 络 传输 到 其 他 地 方 。 
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DA 









































最 佳 实践 是 为 每 个 类 或 者 模块 都 定义 一 个 单独 的 日 志 记录 器 。 











于 Logger 的 名 称 是 由 “.-” 

















隔 的 字符 串 ， 因 此 Logger 的 名 称 不 会 与 类 或 者 模块 名 冲突 ,我 们 还 会 为 日 志 记录 器 定义 一 个 与 






























































程序 的 层次 结构 类 似 的 结构 。 我 们 可 能 会 有 一 个 以 下 面 的 代码 作为 开始 的 类 。 

















import logging 
class Player: 
def _init ( self, bet, strategy, stake ) : 
self.logger= logging.getLogger( self. class . dualname  ) 
self.logger.debug( "init bet {0}, strategy {1}, stake {2}". 
format ( 
bet, strategy, stake) ) 


这 段 代 码 会 确保 这 个 类 使 用 的 Logger 对 象 的 名 称 与 当前 类 的 全 名 匹配 。 






































14.1.1 创建 共享 的 类 级 记录 器 








正如 我 们 在 第 8 章 “ 装 饰 器 和 mixin 


















































横 切 方面 ”中 看 到 的 ， 通 过 在 类 的 外 部 创建 日 志 记录 





























器 的 装饰 器 ， 可 以 让 定义 类 级 的 日 志 记录 器 变 得 更 清晰 一 些 。 下 面 是 我 们 定义 的 装饰 器 。 

















def logged( class ) : 
class .logger= logging.getLogger( class . qualname  ) 
return class_ 


这 段 代码 将 logger 创建 为 类 的 一 个 属性 ， 所 有 的 实例 都 可 以 使 用 这 个 属性 。 现 在 ,可 以 像 下 




















面 这 样 定义 类 。 





Qlogged 
class Player: 
def _init ( self, bet, strategy, stake ) : 
self.logger.debug( "init bet {0}, strategy {1}, stake {2}".format( 
bet, strategy, stake) ) 
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段 代码 可 以 确保 类 中 日 志 记录 器 的 名 称 和 我 们 预期 的 一 致 。 然 后 ， 就 可 以 在 各 个 方法 中 使 用 
self.logger， 并 且 对 于 它 是 正确 的 1ogging .Logger 实例 充满 信心 。 

当 我 们 创建 Player 实例 时 , 会 想 要 尝试 使 用 一 下 日 志 记 录 器 。 默 认 情 况 下 ,我 们 不 会 看 到 任 
何 输出 。logging 模块 的 初始 配置 没有 包含 任何 能 够 生成 输出 的 hanlder 或 者 日 志 级 别 。 为 了 看 到 
一 些 输出 ， 我 们 需要 修改 1ogging 的 配置 。 

使 用 logging 模块 的 最 大 好 处 是 可 以 在 类 和 模块 中 使 用 日 志 记 录 的 功能 ， 而 不 用 担心 全 局 的 
配置 问题 。 默 认 的 行为 是 无 声 的 ， 并 且 只 会 带 来 一 点 点 开销 。 基 于 这 个 原因 ， 我 们 可 以 在 每 个 类 中 
都 包含 日 志 记 录 的 功能 
14.1.2 ”配置 日 志 记 录 需 

为 了 能 够 在 日 志 中 看 到 输出 ， 我 们 需要 提供 两 个 配置 信息 。 

@ 把 我 们 使 用 的 日 志 记录 器 与 一 个 可 以 生成 明显 输出 的 handler 关联 起 来 。 

@ 这 个 handler 需要 一 个 用 于 传递 日 志 信息 的 日 志 级 别 。 
































Logging 模块 包含 了 说 
单独 介 























绍 logging.config.di 


logging.basicConfig() 方 法 根据 一 











F 多 配置 方法 ， 我 们 会 在 这 里 向 你 


ctConfig() 。 





示 logging.basicConfig() 。 


稍 后 














H 





些 参数 来 创建 





个 用 











于 记录 输 强 








LI 














handlers.StreamHandler。 疹 


import logging 
import sys 
logging.basicConfigl( 


段 代 码 会 配置 一 个 用 了 








stream=sys.stderr, 


六 向 sys .stderr 写 入 信息 

















二 





级 别 大 于 等 于 给 定 日 志 级 别 的 信息 。 
级 别 是 10gging .WARN。 
完成 了 这 个 配置 之 后 ， 


>>> p= Player!( 
DEBUG:P1 

















27 "3 ) 


pe 














还 包含 其 

















LogRecord 上 


就 可 以 看 到 调试 信息 


示 日 志 级 别 〈DI 
他 的 一 些 可 以 显示 的 





可 以 用 








logging .DF 


已 


了 。 








ayer:init bet 1, strategy 2, stake 3 


志 记 录 器 的 名 称 
属性 。 通 常 ， 这 个 默认 格式 就 足够 了 。 
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EBUG )、 日 

















14.1.3 ”开始 和 关闭 日 志 记 录 系 统 


logging 模块 禁止 手动 地 人 


























些 模块 ! 





包含 logging， 而 在 





医改 全 局 的 ; 
将 应 用 程序 写成 独立 的 部 分 ， 然 后 通过 1og 
他 的 模块 ! 


和 





BUG 


E 许 多 情况 下， 我 们 需要 的 就 是 下 盏 


内 StreamHandler 实例 。 它 





的 代码 。 











level=logging.DEBUG ) 
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日 志 的 logging. 








会 传递 














来 确 














大 态 信 息 0 


全 局 的 状态 




















ging 接口 确保 这 些 部 分 之 间 可 以 正常 交互 。 


乍 1ogging 模块 内 部 处 理 


保 能 够 看 到 所 有 的 信息 。 默 认 








rr Ar 中 


成 的 








(Player) 和 入 





E。 我 们 可 


列 如 


日 





> 





完全 不 用 包含 它 ， 不 月 


崩 担心 异 
































EE 容 性 有 问题 或 者 配置 有 和 


























更 重要 的 是 ， 我 们 可 以 记录 应 | 

















的 所 有 请 求 而 不 需要 配置 人 


顶层 的 3 











程序 














FE 何 的 handlers。 

















J 以 在 


VD 


的 


字符 串 。 
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要 脚 














14.1 创建 基本 日 志 327 















































本 完全 可 以 不 用 import logging。 在 本 例 中 ， 日志 代 码 中 不 会 产生 错误 或 者 问题 。 

于 日 志 天 生 就 是 松 耦 合 的 , 因此 在 应 用 程序 的 顶层 只 配置 一 次 是 很 容易 做 到 的 。 我 们 只 应 该 在 

呈 序 的 if name ”== "” main ": 中 配置 1ogging。 我 们 会 在 第 16 章 “ 使 用 命令 行 ” 

羊 细 讲 解 这 点 。 
大 多 数 的 handler 都 包含 缓冲 区 。 大 多 数 情况 下 ， 组 冲 区 将 正常 刷新 。 尽 管 不 用 在 意 日 志 系 统 

是 如 何 关 闭 的 ， 但 是 用 1ogging.shutdovwn () 确保 所 有 的 缓冲 区 都 被 刷新 了 会 更 可 靠 一 些 。 

当 处 理 顶 层 的 错误 和 有 异常 时 ， 我 们 有 两 种 明确 的 技术 用 于 确保 所 有 的 缓冲 区 都 被 号 入 ， 其 中 一 

种 技术 是 在 try :代码 块 中 使 用 finally 语句 。 


import sys 


































































































加 
; 
晓 
























































让 
让 
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if name == " main ": 





logging.config.dictConfig( yaml.load("log config.yaml") ) 
try: 

application= Main () 

status= application.run() 





except Exception as e: 
logging.exception( e ) 
Status= 2 

finally: 
logging.shutdown () 

sys.exit (status) 


这 个 例子 展示 了 我 们 是 如 何 尽早 配置 1ogging 以 及 尽 可 能 晚 地 关闭 logging 的 。 这 就 确保 了 
尽 可 能 多 的 程序 可 以 使 用 已 经 配置 好 的 日 志 记 录 器 。 这 段 代 码 还 包括 了 一 个 异常 处 理 的 日 志 记录 器 ， 
但 是 ， 在 一 些 程序 中 ， 所 有 的 异常 都 在 main () 函数 中 处 理 ， 使 得 except 语句 显得 多 余 了 。 

另外 一 种 方法 是 用 atexit handler 来 关闭 logging。 






































































































































import atexit 

import sys 

if name == " main ": 
logging.config.dictConfig( yaml.load("log config.yaml") ) 
atexit.register (logging.shutdown) 





trys 
application= Main () 
status= application.run() 





except Exception as e: 
logging.exception( e ) 
Status= 2 

SYS .exit (status) 

NI de di atexit handler 调用 logging.shutdown () 。 当 应 用 
程序 退出 时 ， 会 调用 给 定 的 函数 。 如 果 main () 函数 中 已 经 正确 地 处 理 了 异常 ， 那 么 可 站 简单 得 
多 的 status= main(); sys.exit (status) 蔡 代 try: 块 。 

还 有 第 3 种 技术 是 用 上 下 文 管理 器 来 控制 日 志 记 录 。 我 们 会 在 第 16 章 “ 使 用 命令 行 ”中 介绍 
这 种 方法 。 
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14.1.4 ”使 用 命名 的 日 志 记 录 絮 


有 4 种 常见 的 需要 用 logging.getLogger () 为 Loggers 命名 的 情况 ， 我 们 通常 会 选择 和 











加 








的 


的 引用 。 通 常会 定义 一 个 全 局 的 Logger， 而 且 通 常 这 个 创建 过 程 在 模块 的 头 部 完成 。 在 














j 程 序 结构 一 致 的 名 称 。 
@ ”模块 名 : 当 


个 










































































模块 包含 大 量 的 小 函数 或 者 创建 大 量 对 象 的 类 时 ， 我 们 可 能 会 声明 一 个 模块 级 
局 Logger 实例 。 例 如 ， 当 扩展 tuple 时 ， 我 们 不 希望 每 个 实例 中 都 包含 一 个 Logger 









































当 我 们 在 ”init _() 方 法 中 创建 Logger 时 ， 展 示 过 在 对 


Logger 的 例子 。 这 里 ， 每 个 对 象 中 的 Logger 都 是 唯一 的 ， 想 单纯 通过 
































能 会 导致 一 些 令 人 误解 的 情况 ， 因 为 一 个 类 可 以 有 多 个 实例 。 一 个 更 好 的 





本 例 中 ， 就 在 imports 之 后 。 

import logging 

logger= logging.getLogger( name  ) 
@ 对 象 实例 : 在 前 面 的 代码 中 ， 妆 

象 实例 中 使 用 

全 名 来 区 分 可 

设计 是 在 日 志 记录 器 的 名 称 中 包含 一 个 唯一 


def init 























_( self, player name ) 


self.name= player name 














的 实例 标识 符 。 


self.logger= logging.getLogger( "{0}.{1}".formatl( 


self. class . dualname , 








player name ) ) 


@ 类 名 : 之 前 我 们 定义 简单 的 装饰 器 时 ， 演 示 过 如 何在 类 中 使 用 Logger。 我 们 可 以 用 

































































_class . qualname 作为 Logger 的 名 字 并 且 将 Logger 作为 一 个 整体 赋值 给 类 。 
该 类 的 所 有 实例 会 共享 这 个 Logger。 


@ 隐 数 名 : 对 于 经 常 使 用 的 小 函数 ， 经 常会 使 / 




















型 函数 ， 可 能 会 在 函数 中 创建 日 志 。 


| 


def main() : 























log= logging.getLogger ("main™") 

















这 里 最 习 





调试 过 程 。 


但 是 ， 在 一 些 必 

















EE 要 的 是 确保 Logger 的 名 称 与 软 从 














类 但 属于 不 同 利 









































Loggers 


人 











前 面 展示 的 模块 级 日 志 。 对 于 很 少 使 用 的 大 








架构 相符 ， 这 为 我 们 提供 了 最 透明 的 日 志 ,， 简化 了 








4 况 下 ， 我 们 可 能 会 创建 一 个 更 复杂 的 Logger 集合 。 有 可 能 来 自 于 同一 个 
类 的 信息 。 两 个 常见 的 例子 是 财务 审计 日 志和 安全 访问 日 志 。 我 们 可 能 希望 
有 一 些 平行 的 结构 : 一 个 以 auqit .作为 名 称 的 前 缀 ,， 另 一 个 以 security .作为 









































名 称 的 前 级 。 一 个 类 可 能 会 包含 更 特定 的 Loggers， 例 如， 以 audit .moqule.Class 或 者 


security.module.Class 为 名 的 Loggers。 


self.audit log= logging.getLogger( 





~»E 
一 个 类 ! 








包含 多 个 






































"audit." + self. class . qdqualname  ) 
日 志 对 象 允 许 我 们 更 精细 地 控制 输出 的 类 型 ,我 们 可 以 为 每 个 Logger 配置 
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不 同 的 nandlers。 在 下 面 的 部 分 中 ， 我 们 会 使 用 更 高 级 的 配置 将 输出 重 定 癌 到 不 同 的 目标 位 置 。 
14.1.5 扩展 日 志 等 级 
logging 模块 预定 义 了 5 个 重要 性 级 别 。 每 个 级 别 都 有 一 个 (或 者 两 个 ) 带 有 级 别 号 码 的 全 
局 变量 。 重要 性 级 别 代 表 的 是 从 调试 信息 (很 少 重要 到 需要 显示 出 来 ) 到 关键 的 或 是 致命 的 错误 (总 
是 非常 重要 ) 的 一 个 可 选 范 围 。 
日 志 模 块 变 量 值 
DEBUG 10 
INFO 20 
WARNING 或 者 WARN 30 
ERROR 40 
CRITICAL 或 者 FATAL 50 
如 果 需 要 更 精细 地 控制 哪些 信息 可 以 用 ， 哪 些 信 息 需 要 拒绝 ， 我 们 可 以 添加 额外 的 级 别 。 例 如 ， 
一 些 应 用 程序 支持 多 个 详细 级 别 。 类 似 地 ， 一些 应 用 程序 包含 了 不 同 级 别 的 调试 信息 。 对 于 不 需要 太 多 
言 息 的 普通 日 志 ， 我 们 可 能 会 将 日 志 级 别 设 置 为 1ogging. WARNING， 这 样 只 有 警告 和 错误 信息 会 被 
输出 。 对 于 详细 程度 的 第 1 个 级 别 ， 为 了 查看 提示 性 信息 ， 我 们 可 以 将 级 别 设 为 logging.INFO。 对 
于 详细 程度 的 第 2 个 级 别 , 我 们 会 希望 添加 一 个 值 是 15 的 级 别 ， 让 根 日 志 记 录 器 包含 这 个 新 级 别 。 
我 们 可 以 像 下 面 这 样 定义 详细 信息 的 新 级 别 。 
logging.addLevelName (15, "VERBOSE") 
logging.VERBOSE= 15 
可 以 通过 Logger .1og() 方 法 使 用 新 级 别 ， 这 个 方法 接受 一 个 级 别 数字 作为 参数 。 


全 二 和 




















个 级 另 








站 加 


| 将 很 多 概念 合 
一 个 简单 的 可 见 性 或 者 错误 范围 。 





ogger.1log( 


于 添加 一 个 像 这 样 的 级 别 不 会 
并进 了 一 个 单独 














logging.y 








ERBOSE, 


"Some Message" 


) 

















的 数字 代码 








带 来 什么 额外 的 





开销 》 





大 











此 它们 经 常 被 滥用 。i 




















可 见 性 





























roy 

















14.1.6 ”定义 指 回 多 个 目标 输出 的 handler 










































































和 错误 行为 ,级 别 ee 限于 / 
任何 更 复杂 的 部 分 都 应 该 通过 Logger 名 称 或 者 Filter 对 象 来 完成 。 





] 来 表示 


























有 些 情况 下 ， 我 们 需要 将 日 志 发 送 到 多 个 不 同 的 目标 ， 如 下 所 示 。 

@ 可 能 希望 有 两 份 日 志 ， 这 样 可 以 提高 运营 的 可 靠 性 。 

@ 可 能 希望 使 用 复杂 的 Filter Sh 息 创建 子 集 。 

@ 可 能 希望 为 不 同 的 目标 定义 不 同 的 级 别 ， 通 过 这 种 方式 分 离 调 试 信息 和 指示 性 信息 。 
@ 可 能 希望 基于 Loggers 的 名 称 定义 不 同 的 handlers 来 代表 不 同 的 日 志 源 。 
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2 





然 ， 我 们 也 能 把 这 些 合并 起 来 用 于 十 分 复杂 的 情况 。 
Handlers。 每 个 Handler 可 


Filters 对 象 的 列表 。 
































为 了 创建 多 个 目标 输出 ， 必 须 创建 多 个 


能 包含 一 个 自 定义 的 Formatter、 一 个 可 选 的 级 别 和 一 个 可 选 的 


一 旦 定义 好 了 多 个 Handlers， 我 们 就 可 以 将 Loggers 与 对 应 的 Handlers 绑 定 起 来 。 


























种 适当 的 层次 结构 , 这 意味 着 我 们 可 以 ) 
包含 了 一 个 级 别 过 滤器 


Loggers 会 创建 
到 Handlers。 由 于 Handlers :! 
别 输出 不 同类 型 的 信息 。 同 样 地 ， 女 

尽管 我 们 可 以 通过 logging 模块 的 API 配置 
节 定 义 在 配置 文件 中 。 一 个 优雅 的 解决 方案 是 月 
接 的 方法 加 载 字 ] 

YAML 标记 configparser 作为 默认 标记 显得 更 简洁 
config 的 文档 就 使 用 了 YAML 作为 范例 ， 因 为 这 种 标记 法 



































目标 输出 ， 





可 
























































AS 




































































下 面 是 包含 了 两 个 handlers 和 两 个 loggers 配置 文 从 


version: 1 
handlers: 
console: 

class: logging.StreamHandler 


stream: ext://sys.stderr 


formatter: basic 
audit file: 
class: logging.FileHandler 


filename: p3 cl14 audit .1og 
utf-8 
basic 


encoding: 
formatter: 
formatters: 
basic: 
用 时 
nm 


style: 
format: 
loggers: 
verbose: 
handlers: [console] 
level: INFO 
audit: 
handlers: [audit file] 


level: INFO 


我 们 定义 了 两 个 处 至 
主意 ， 我 们 必 


StreamHandler。 请 当 
Python 资源 。 在 当前 上 下 文 ! 























须 以 URI 风格 语法 

















I 果 需 要 更 复杂 的 过 滤 操 作 ， 我 们 可 


日 YAML 标记 作为 
使 用 logging.config.dictConfig(yaml. load(somefile))。 


， 外 部 的 意思 是 配置 文件 的 外 部 。 这 个 假 





高 层 或 者 低层 的 名 称 将 Loggers 绑 定 
， 我 们 可 以 让 不 同 的 Handlers 基于 级 
| 以 显 式 地 使 用 Filter 对 象 。 
青 晰 一 些 的 通常 做 法 是 将 日 志 
置 字典 。 可 以 用 一 种 相对 直 









































但 是 ， 更 ; 
配 





































































































一 些 。Python 标准 库 中 关于 logging. 
E 常 简洁 ， 所 以 我 们 会 遵循 这 个 模式 。 


F 的 范例 。 





levelname:s}:{name:s}:{message:s}" 


程序 console 和 adudit _file。console 是 发 送 到 sys .stderr 的 


的 ext://sys.stderr 来 命名 外 部 的 
设 是 当前 的 值 个 简单 的 3 








目 
A 
































符 串 ， 而 不 是 一 个 指向 某 个 对 象 的 引用 。auqdit_file 是 
默认 情况 下 ， 会 用 a 模式 打开 文件 ， 向 文件 末尾 添加 内 容 。 
我 们 还 定义 了 一 个 格式 化 器 ， 命 名 为 basic， 它 根 直 





























导 


个 会 写 入 指定 文件 中 的 FileHandler。 


引得 
狼 侍 





我 们 从 basicCconfig() 中 的 格式 











来 生 




















成 
只 包含 
三 


节 厂 





志 格 式 。 如 果 我 们 不 使 用 它 
言 息 文本 。 
后 ， 我 们 定义 了 两 个 顶层 的 日 
记录 器 都 会 使 用 verbose 实例 。 


















































它 ， 我 们 的 信息 会 使 用 一 个 有 些 不 同 的 默认 格式 ， 


志 记 录 器 : verbose 和 audqit。 所 有 顶层 名 称 为 verbose 的 
然后 ， 我 们 就 能 



















































































类 似 verbose .example . 
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14.1 创建 基本 日 志 





这 种 默认 格式 


VD 


SomeClass 这 






























































样 的 Logger 名 称 来 创建 verbose 的 子 实例 。 每 个 日 志 记录 器 中 都 可 以 包含 多 个 处 理 程序 ， 在 本 
例 中 ， 只 包含 了 一 个 。 另 外 ， 我 们 为 每 个 日 志 记录 器 都 指定 了 日 志 级 别 。 

下 面 代码 演示 了 如 何 加 载 这 个 配置 文件 。 

import logging.config 

import yaml 

config dict= yaml.load (config) 

logging.config.dictConfig (config dict) 

我 们 将 YAML 文本 转化 为 dict， 然 后 用 dictconfig () 函数 使 用 指定 的 字典 配置 日 志 。 下 面 是 一 
些 获 取 日 志 记 录 器 并 且 输 出 消息 的 例子 。 

Verbose= logging.getLogger( "verbose.example.SomeClass" ) 

audit= logging.getLogger( "audit.example.SomeClass" ) 


verbose.infol( 
audit.infol( 
我 们 创建 了 两 个 Logger 对 象 ， 
我 们 写 入 verbose 
器 时 ， 我 们 在 命令 行 中 什么 都 看 不 到 ， 记 录 会 写 到 一 
当 我 们 仔细 查看 logging .handlers 模块 时 , 可 以 看 到 有 大 量 的 处 理 
老式 的 $ 风格 的 格式 化 说 明 。 
法 的 不 同 。 当 我 们 定义 格式 化 参数 时 ， 使 用 {风格 的 格式 化 说 明 ， 


情 


T 








;去 





§ 况 下 ，logging 模块 会 使 














志 记 录 器 时 ， 会 在 命 




















6 











14.1.7 管理 传播 规则 


Loggers 的 默认 行为 会 将 
传 到 根 Logger。 我 们 可 以 在 更 低层 的 Loggers : 





入 


"Audit record with before and aft 


一 个 属于 


"Verbose information" ) 


ern ) 








verbose 


全 


令 行 





[上 HH 


中 看 到 输 











家 族 树 ， 另 一 个 
但 是 ， 当 我 


届 于 audit 家 族 树 。 当 
门 写 入 audit 日 志 记 录 











io 


让 丑 




















个 文 





， 文 件 的 名 称 

















呆 存 在 配置 文件 
























































未 





定义 所 有 Loggers 的 默认 行为 。 




















于 


志 记录 的 传播 性 ， 根 日 


志 记 录 从 命名 的 Logger 一 


直 得 








上 经 过 所 有 的 父 














片 


程序 供 我 们 使 








] 。 默认 














这 些 格式 化 说 明 与 str.format () 方 
这 和 str .format ( 


) 是 一 致 的 。 


级 Loggers 














| 三 稳 三 看 3 











包含 一 些 特殊 的 行为 ， 

















录 。 如 果 了 














日 志 i 


局 录 器 定义 了 输出 3 
志 记 录 嚣 轴 














录 ， 然 后 又 从 父 


们 必须 关闭 


我 


或 者 verbose .作为 名 称 前 
] 可 以 配置 
果 我 们 需要 添加 


联 。 我 介 


如 


志 记 录 器 也 需要 处 型 
































痊 出 了 











氏 层 
门 前 面 的 








志 记 录 器 的 传播 4 
列子 中 没有 本 


置 根 级 别 


Li 
让 



































的 Logger。 如 果 我 





子 日 志 记录 器 生成 输出 时 ， 





来 自我 们 定义 的 低层 Loggers 的 日 
允许 传播 ， 这 会 导致 重复 的 输出 : 
如 果 我 们 想 要 








但 














是 需要 在 根 Logger : 








志 记 
第 1 个 输出 来 自 子 日 志 记 
避免 重复 ,我 



































门 应 用 程序 ! 





























级 创建 日 志 记 录 器 ， 








的 某 些 部 分 








没有 以 audit . 











那么 这 个 额外 的 日 志 


















































个 更 高 层 的 名 称 或 者 配置 











个 可 以 捕获 全 部 信 ， 





















































个 根 级 别 的 





志 记 





录 器 来 捕 





志 








记录 器 不 会 与 Handler 关 
息 的 根 级 别 的 
这 些 其 他 名 称 ， 那 么 我 们 要 注意 传播 法 则 。 











日 志 记 录 器 。 
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下 














外 是 对 配置 文 伯 





loggers: 


verbose: 


handl 
level: 


ers: 
INFO 


propagate: 


audit: 
handl 
level: 


ers: 
INFO 


propagate: 


root: 


handl 
level: 


我 们 关闭 了 两 个 低层 的 日 








志 记 录 器 。 





# Added 
ers: 
INFO 





F 的 修改 。 


[console] 
False # Added 
[audit file] 
False # Added 


[console] 








志 记 录 器 上 





于 这 个 日 








如 果 我 们 不 关心 这 两 个 

















都 会 被 处 理 








两 次 。 丰 





志 记 录 

















的 传播 ] 





氏 层 

















输出 一 次 ， 同 时 也 会 写 入 审计 文件 中 。 


志 记 录 器 
FE audit 的 例子 中 ， 处 理 两 次 可 能 正好 是 我 们 所 预 
















































































器 没有 名 称 ， 所 以 我 们 声明 了 一 个 与 1oggers :平行 的 顶 
的 传播 功能 ， 那 么 verbose 或 者 audit 的 每 条 记录 
其 的。 审计 数据 会 在 命令 行 


功能 : verbose 和 audit， 添 加 了 一 个 新 的 根 级 别 的 日 























屋 字 


root:。 







































































关于 logging 模块 的 重点 是 不 用 修改 现 有 的 应 用 程序 就 可 以 改进 和 控制 日 志 记 录 。 通 过 配置 
文件 ， 我 们 几乎 可 以 完成 任何 需求 。 由 于 YAML 是 一 种 相对 比较 优雅 的 标记 法 ， 因 此 我 们 可 以 很 简 
单 地 编码 许多 功能 。 











14. 2 理解 配置 


~ 


























































































































































































































志 处 理 器 。 



































任何 全 局 











basicConfig() 方 法 能 够 保留 在 完成 配置 之 前 创建 的 所 有 日 志 处 理 器 。 但 是 ，logging. 
config.dictConfig() 方 法 会 默认 禁用 所 有 在 配置 完成 前 创建 的 日 志 处 理 器 。 

当 组 建 一 个 庞大 复杂 的 应 用 程序 时 ， 在 import 过 程 中 ， 我 们 可 能 会 创建 模块 级 的 日 
主 脚 本 引入 的 模块 可 能 会 在 logging .config 创建 完成 之 前 创建 日 志 记 录 器 。 同 样 地 ， 
的 对 象 或 者 类 定义 都 可 能 在 配置 完成 前 创建 日 志 记录 器 。 

我 们 通常 需要 在 配置 文件 中 添加 下 面 这 行 代码 。 

disable existing loggers: False 











这 行 代码 可 以 确保 配置 完成 前 创建 的 所 有 日 














日 








志 记 录 器 : o 
































14. 3 ”为 控制 、 调 试 、 审 计 和 安全 创建 专门 的 日 志 





日 志 有 很 多 不 同 种 类 ， 我 们 会 关注 下 面 的 4 种 。 








志 处 理 器 仍然 会 将 信息 传播 到 配置 文件 创建 的 根 


14.3 为 控制 、 调 试 、 审 计 和 安全 创建 专门 的 日 志 ”333 




















@ ”错误 和 控制 (Errors and Contrrol): 应 用 程序 基本 的 错误 和 控制 产生 的 主要 日 志 用 于 帮助 
用 户 确认 程序 是 否 真 的 按 他 们 所 预期 的 结果 运行 。 这 种 日 志 会 包含 足够 的 错误 信息 ， 用 户 
可 以 用 这 些 信息 修正 他 们 的 问题 然后 重新 运行 应 用 程序 。 如 果 用 户 启用 了 详细 日 志 ， 它 会 

在 这 个 主要 的 错误 日 志 中 记录 更 多 的 信息 ， 并 且 为 日 志 控制 提供 更 多 用 户 友好 的 细节 

@ 调试 (Debugging): 程序 员 和 运 维 工程 师 会 使 用 这 种 日 志 , 它 可 以 包含 更 复杂 的 实现 细节 。 
我 们 几乎 不 会 想 要 启用 完整 的 调试 日 志 ， 但 是 经 常会 针对 特定 的 模块 或 者 类 启用 调试 日 志 。 

@ 设计 〈Audit): 这 种 日 志 用 于 正式 确认 追踪 的 数据 已 经 改变 ， 这 样 我 们 就 可 以 保证 所 有 的 
处 理 过 程 都 正确 完成 了 。 

@ 安全 (Security): 这 种 日 志 可 以 被 用 来 记录 哪些 用 户 通过 了 验证 ， 还 可 以 用 来 确认 程序 遵 
守 了 授权 规则 。 它 也 能 被 用 于 检测 某 些 涉及 重复 密码 失败 类 型 的 攻击 。 











































































































































































































































































































































































































































































































对 于 这 些 不 同 种 类 的 日 志 ， 我 们 常常 会 有 不 同 的 格式 和 处 理 的 需求 。 同 样 地 ， 这 些 日 志 中 的 一 部 
分 可 以 被 随时 启用 或 者 禁用 。 主 要 的 错误 日 志和 控制 日 志 通 常 只 包含 非 调试 信息 。 我们 可 能 会 有 一 个 
应 用 程序 的 结构 类 似 下 面 的 代码 。 























from Collections import Counter 
class Main: 
def _ init ( self ): 
self.balance= Counter () 
self.log= logging.getLogger( self. class . qualname  ) 
def run( self ): 
self.log.info( "Start" ) 


# Some processing 
self.balance['count'] += 1 
self.balance['balance'] += 3.14 





self.log.info( "Counts {0}".format (self.balance) ) 


for k in self.balance: 
self.log.info( "{0:.<16s} {1l:n}".format (k, self.balance[k]) ) 

















我 们 创建 了 一 个 与 类 的 全 名 〈Main) 匹配 的 日 志 记 录 器 。 我 们 已 经 往 这 个 日 志 记录 器 : 
写 入 了 提示 性 信息 用 于 展示 应 用 程序 正常 启动 和 停止 。 在 本 例 中 , 我 们 用 Ccounter 收集 余额 
的 信息 ， 这 些 信息 可 以 用 来 确认 已 经 处 理 过 的 数据 的 数量 是 正确 的 。 

在 某 些 情况 下 ， 在 处 理 结 束 时 ， 我 们 会 显示 更 正式 的 余额 信息 。 我 们 可 能 会 用 类 似 下 面 这 样 的 
代码 提供 更 容易 阅读 的 信息 。 






























































































































































for k in balance: 
self.log.info( "{0:.<16s} {1l:n}".format (k, balance[k]) ) 

















这 个 版 本 会 在 日 志 中 用 独立 的 行 显 示 键 和 值 。 错 误 和 控制 日 志 通 常 使 用 最 简单 的 格式 ， 这 种 日 
志 中 可 能 只 会 展示 信息 文本 和 少量 其 他 文本 ,或 者 完全 没有 其 他 文本 。 我 们 可 能 会 使 用 类 似 下 面 
样 的 方式 来 使 用 日 志 Formatter 对 象 。 


















































fx 
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formatters: 
control: 


SLE 





format: "{levelname:s}: {message:s}" 


























这 样 的 配置 让 formatter 展示 日 志 级 别名 称 (INFO、WARNING、ERROR、CRITICAL) 和 信 
息 文本 。 这 里 忽略 了 大 量 的 细节 , 只 为 用 户 提供 了 基本 的 好 处 。 我 们 把 这 个 格式 化 器 称 为 control。 
在 下 面 的 代码 中 ， 我 们 将 控制 格式 化 器 和 命令 行 处 理 程序 结合 使 用 。 


handlers: 








































































































console: 
class: logging.StreamHandler 
stream: ext://sys.stderr 
formatter: control 


这 段 代码 将 control formatter 和 console handler 一 起 使 用 。 


14.3.1 创建 调试 日 志 


通常 , 程序 员 会 启用 调试 日 志 来 监视 开发 中 的 程序 。 它 通常 是 只 关注 特定 的 功能 、 模块 或 者 类 。 
因此 ， 我 们 会 经 常 通过 名 称 启用 或 者 禁用 日 志 记 录 器 。 在 配置 文件 中 ,我 们 可 能 只 会 将 一 些 日 志 记 
录 器 的 级 别 设 为 DEBUG， 而 其 他 的 都 是 INFO 甚至 可 能 是 WARNING 级 别 。 

我 们 常常 会 将 调试 信息 的 设计 作为 类 设计 的 一 部 分 。 事实 上 , 我 们 可 能 会 将 调试 能 力作 为 类 设 
计 中 一 个 特殊 的 质量 功能 。 这 可 能 意味 着 要 接受 大 量 的 日 志 请 求 。 例 如 ,我 们 可 能 会 基于 基本 的 类 
状态 信息 执行 复杂 的 计算 。 


Qlogged 
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中 





可 

































































class OneThreeTwoSix( BettingStrategy ) : 
def _ init ( self ) : 
self.wins= 0 
def _state( self ) : 
return dict( wins= self.wins ) 
def bet( “Seltf ks 
bet= { 0: 1, 1: 3, 2: 2, 3: 6 }[self.wins%4] 
self.logger.debug( "Bet {1}; based on {0}".format (self._ 
state(), bet) ) 
def record win( self ) : 
self.wins += 1 
self.logger.debug( "Win: {0}".format (self. state()) ) 
def record loss( self ): 
self.wins = 0 


self.logger.debug( "Loss: {0}".format (self. state()) ) 









































在 这 个 类 定义 中 ， 我 们 创建 了 一 个 _state () 方法 用 于 暴露 相关 的 内 部 状态 ， 这 个 方法 只 是 
来 支持 调试 需要 。 我 们 禁止 使 用 self. dict ， 因 为 通常 这 样 会 包含 太 多 无 用 的 信息 。 然 后 ， 
我 们 就 可 以 在 方法 函数 的 不 同位 置 追踪 这 个 状态 的 变化 。 
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调试 输出 通常 是 通过 修改 配置 文件 中 用 于 启用 /禁用 调试 的 配置 选择 性 地 启用 ， 参 照 下 面 这 个 
修改 配置 文件 。 
loggers: 
betting.OneThreeTwoSix: 
handlers: [console] 
level: DEBUG 
propagate: False 
我 们 基于 类 的 全 名 来 标识 特定 类 的 日 志 记 录 器 。 本 例 中 假设 已 经 定义 了 一 个 名 为 console 的 
处 理 程序 ， 关 闭 日 志 传 播 ， 这 样 就 可 以 避免 调试 信息 被 复制 到 根 日 志 记 录 器 中 。 
这 种 设计 的 潜在 想法 是 我 们 不 希望 简单 地 在 命令 行 中 通过 -D 选项 或 者 -DEBUG 选项 就 可 以 启 
用 调试 日 志 。 为 了 进行 高 效 的 调试 ， 我 们 通常 希望 可 以 通过 配置 文件 选择 性 地 启用 日 志 记 录 器 。 我 
们 会 在 第 16 章 “ 使 用 命令 行 ”中 介绍 命令 行 的 问题 。 































































































































































































































































































































































































志 记 录 器 创 
日 志 级 别 是 很 









































为 它们 不 
























































14.3.2 ”创建 审计 和 安全 日 志 
审计 和 安全 日 志 通 常会 在 两 个 处 理 程 序 中 重复 : 主 控制 处 理 程序 和 用 来 检查 审计 与 安全 的 文件 
处 理 程序 ， 这 意味 着 我 们 需要 做 下 面 几 件 事 情 。 
@ 为 审计 和 安全 定义 额外 的 日 志 处 理 器 。 
@ 为 这 个 日 志 处 理 器 定义 多 个 处 理 程序 。 
@ 可 选 地 为 审计 处 理 程序 定义 不 同 的 格式 。 
正如 前 面 所 展示 的 ， 通 常 ， 我 们 会 为 审计 或 者 安全 日 志 创建 独立 的 日 志 结构 。 为 日 
建 独立 的 结构 比 尝试 通过 新 的 日 志 级 别 引 入 审计 或 者 安全 日 志 要 简单 得 多 。 创 建新 的 
有 挑战 的 ， 因 为 信息 本 质 上 属于 INFO 信息 ; 它们 不 属于 偏向 WARNING 方面 的 INFO， 因 
是 错误 ， 同 时 它们 也 不 属于 DEBUG 方面 的 INFO， 因 为 它们 不 是 可 选 的 。 
下 面 是 可 以 用 来 创建 包含 审计 功能 的 类 的 装饰 器 。 
def audited( class ): 
class .logger= logging.getLogger( class . qualname  ) 
class .audit= logging.getLogger( "audit." + class . qualname  ) 


了 audit. 前 


return class_ 


这 个 装饰 器 创建 了 两 个 日 志 记 录 器 。 一 个 的 名 称 和 类 的 全 名 相同 ， 另 一 个 在 类 全 名 前 加 


级 ， 


Qaudited 





这 个 日 





class Table: 


def bet ( 


self, 
self.audit.infol( 


我 们 创建 了 一 个 会 在 audit 层次 结构 的 日 














志 记 录 器 就 属 了 





bet, 














amount 
"Bet {0} Amount {1}".format (bet, amount) ) 





审 


日 志 层 次 体系 。 





计 





下 














六 








人 














里 这 























志 记录 器 额外 的 层次 结构 ， 来 看 一 下 我 们 需要 的 两 个 处 理 程序 。 








而 演示 了 如 何 使 


志 记 录 器 中 生成 记录 的 类 。 我 们 可 以 本 














j 这 个 装饰 器 。 





on 
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志 系 统 
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handlers: 

console: 
class: logging.StreamHandler 
stream: ext://sys.stderr 
formatter: basic 

audit file: 
class: logging.FileHandler 
filename: p3 cl14 audit .1og 
encoding: utf-8 
formatter: detailed 



























































console 处 理 程序 用 basic 格式 记录 面向 用 户 的 日 志 ，aduit_file 处 理 程序 使 用 更 复杂 的 
detailed 格式 化 器 。 下 面 是 这 些 nandlers 引用 的 formatters。 

















formatters: 

basic: 
style: "{" 
format: "{levelname:s}: {name:s}:{message:s}" 

detailed: 
style: "{" 
format: "{levelname:s}: {name:s}:{asctime:s}: {message:s}" 
datefmt: "%Y-%m-%d %$H:%M:%S" 


basic 格式 只 会 显示 信息 的 3 个 属性 。gdetailed 格式 会 复杂 一 些 ， 因 为 日 期 的 格式 和 信息 的 


















































其 他 格式 是 用 不 同 的 方式 完成 的 。 我 们 用 { 风 格格 式 化 全 局 信息 ， 下 面 是 两 个 Logge 的 定义 。 
loggers: 
audit: 


handlers: [console,audit filel] 
level: INFO 
propagate: True 
EOOt:: 
handlers: [console] 
level: INFO 


我 们 为 audit 层次 结构 定义 了 一 个 日 志 记 录 器 。audit 的 所 有 孩子 都 会 将 消息 写 入 console 
Handler 和 audit file Handler 中 。 根 日 志 记 录 器 会 规定 其 他 的 日 志 记 录 器 只 能 使 用 console。 
现在 ， 我 们 将 会 看 到 两 种 审计 消息 。 

console 可 能 包含 下 面 这 样 的 内 容 。 


INEO:audit .Table:Bet One Amount 1 
INEO:audit .Table:Bet Two Amount 2 


audit file 看 起 来 可 能 类 似 下 面 这 样 。 


INFO:audit.Table:2013-12-29 10:24:57:Bet One Amount 1 
INFO:audit.Table:2013-12-29 10:24:57:Bet Two Amount 2 


这 种 重复 记录 日 志 的 方式 不 但 为 我 们 提供 了 主 console 日 志 上 下 文中 的 
的 审计 信息 保存 在 单独 的 日 志文 件 中 以 供 日 后 分 析 使 用 。 






































































































































计 信息 ， 同 时 也 将 重点 








Bunt 
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14.4 使 用 warnings 模块 


下 向 对 象 开 发 往往 需要 对 类 或 模块 进行 重大 的 重 构 。 当 我 们 第 1 次 编写 应 用 程序 时 ， 很 难保 证 

API 是 完全 正确 的 。 事 实 上 ， 在 设计 中 为 了 确保 API 完全 正确 所 花费 的 时 间 可 能 是 浪费 的 : 当 我 们 

更 深入 地 了 解 了 问题 域 和 用 户 的 需求 之 后 ，Python 的 灵活 性 允许 大 规模 地 修改 现 有 程序 。 
我 们 可 以 用 来 支持 设计 演化 过 程 的 其 中 一 个 工具 就 是 warnings 模块 。 对 于 warnings 模块 , 有 

两 个 明显 的 和 一 个 模糊 的 用 例 。 
@ 用 于 提醒 开发 者 API 的 变化 ， 通 常用 于 废弃 的 或 者 即将 废弃 的 功能 。 默 认 情 况 下 ， 废 弃 和 

即将 废弃 的 警告 不 会 出 现 。 当 运行 unittest 模块 时 ， 这 些 消息 不 会 被 隐藏 ， 这 可 以 帮 
助 确保 我 们 在 正确 使 用 最 新 的 包 。 
@ 用 于 提醒 用 户 配 置 有 问题 ,。 例如, 某 个 模块 可 能 有 一 些 可 选 实现 , 当 最 佳 的 实现 不 可 用 时 ， 

我 们 希望 可 以 警告 用 户 当 前 没有 在 使 用 最 佳 的 实现 。 

@ 我 们 可 能 会 通过 警告 用 户 计算 结果 中 可 能 包含 其 他 问题 的 方式 打破 极限 。 我们 的 应 用 程序 
可 以 运行 的 范围 是 很 模糊 的 。 
对 于 前 两 种 情况 ,我 们 通常 会 使 用 Python 的 warnings 模块 显示 有 一 些 可 以 修复 的 问题 。 对 

于 第 3 种 情况 ， 我 们 可 能 会 用 logger .warn () 方法 警告 用 户 有 一 些 潜在 的 问题 。 对 于 这 种 潜在 问 

题 的 情况 ， 我 们 不 应 该 依赖 于 warnings 模块 ， 因 为 默认 情况 下 ， 和 警告 信息 只 会 显示 一 次 。 

在 一 个 应 用 程序 中 ， 我 们 可 能 会 看 到 下 面 这 些 行 为 。 

@ ”理想 情况 下 ， 应 用 程序 正常 结束 并 且 完 成 所 有 工作 ， 这 样 的 结果 确定 是 有 效 的 。 

@ ”应 用 程序 生成 了 一 些 警 告 信息 ， 但 是 仍然 正常 结束 ， 这 些 警 告 信息 意味 着 结果 不 可 和信。 所 有 的 
输出 文件 都 是 可 读 的， 但 是 这 些 输出 的 质量 和 完整 性 值得 怀疑 。 这 种 情况 可 能 会 让 用 户 感 到 
迷惑 ， 在 下 面 的 部 分 中 ， 我 们 会 围绕 这 些 特殊 的 不 确定 性 来 展示 软件 设计 中 一 些 潜在 的 问题 。 

@ 应 用 程序 可 能 生成 了 一 些 错 误 信 息 ， 但 是 仍然 正常 结束 了 。 很 明显 ， 这 样 的 结果 肯定 是 错 
误 的 并 且 不 应 该 被 用 于 除 调试 以 外 的 任何 场景 。 Logging 模块 可 以 帮助 我 们 再 细 分 这 些 错 
误 。 一 个 产生 了 错误 的 程序 可 能 仍然 可 以 正常 结束 。 我 们 通常 用 CRITICAL (或 者 FATAL) 
来 指出 Python 程序 可 能 没有 正确 终止 ， 而 且 输 出 的 文件 可 能 有 损坏 。 我 们 通常 将 

CRITICAL 保留 给 顶层 的 try : 块 使 用 。 

@ ”程序 可 能 会 在 操作 系统 级 别 上 崩 演 。 在 这 种 情况 下 ，Python 的 异常 处 理 和 日 志 系 统 可 能 不 
会 生成 任何 消息 。 同 样 地 ， 这 种 情况 下 生成 的 结果 是 不 可 用 的 。 

第 2 种 情况 中 的 值得 怀疑 的 结果 不 是 一 个 好 设计 。 使 用 警告 不 管 是 用 warnings 模块 还 

是 1ogging 中 的 WARN 信息 对 用 户 并 没有 太 大 帮助 。 


14.4.1 用 警告 信息 显示 API 变化 
当 我 们 改变 某 个 模块 、 包 或 者 类 的 API 时 ， 可 以 用 warnings 模块 提供 一 个 方便 的 标记 。 这 
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会 在 已 经 废弃 的 或 者 即将 废弃 的 方法 中 抛 出 一 个 警告 信息 。 


import warnings 
class Player: 
__ version = "2.2" 
def bet( self ): 
warnings.warn( "bet is deprecated, use place bet", 
DeprecationWarning, stacklevel=2 ) 


etcs; 
我 们 这 么 做 之 后 ， 任 何 调用 Player .bet () 的 应 用 程序 都 会 收 到 Deprecation Warning。 
默认 情况 下 ， 这 种 警告 信息 不 会 显示 。 但 是 ， 我 们 可 以 通过 调整 warnings 的 过 滤器 来 显示 信息 ， 代 
人 码 如 下 所 示 。 


>>> warnings.simplefilter("always", category=DeprecationWarning) 




















Ik 

















ene 



































>>> p2= Player() 
>>> p2 .bet () 
_ main :4: DeprecationWarning: bet is deprecated, use place bet 


























这 种 技术 让 我 们 可 以 定位 应 用 程序 中 所 有 因为 API 的 改变 而 需要 一 起 改变 的 地 方 。 如 果 单 元 测 
试 履 善 率 接近 100%， 使 用 这 种 简单 的 技术 可 能 可 以 找 出 所 有 使 用 了 废弃 方法 的 地 方 。 
于 这 种 警告 信息 对 于 计划 和 管理 软件 变更 很 有 价值 , 因此 我 们 有 3 种 方式 用 于 确保 我 们 会 看 
到 应 用 程序 中 的 所 有 警告 信息 。 

@ 命令 行 中 的 -wa 选项 会 将 所 有 警告 的 action 设置 为 daefault。 这 会 启用 普通 的 废弃 警告 。 
当 我 们 运行 python3.3 -Wa 时 ， 我 们 会 看 到 所 有 的 废弃 警告 。 

使 用 总 是 在 warnings .simplefilter('dqefault') 模 式 下 执行 的 unittest 模块 。 

@ 在 我 们 的 程序 中 包含 warnings .simplefilter('dqefault') 。 这 会 将 aefault 应 用 到 所 


有 的 警告 中 ， 与 -Wd 命令 行 选项 相同 。 


14.4.2 ”用 警告 信息 显示 配置 问题 


对 于 茶 个 类 或 者 模块 , 我 们 可 能 会 提供 多 种 实现 。 我 们 通常 会 用 一 个 配置 文件 参数 来 决定 哪 种 
实现 是 适合 的 。 关 于 这 种 技术 的 更 多 细节 ， 参 见 第 13 章 “ 配 置 文件 和 持久 化 ”。 

但 是 ,在 一 些 情况 下 ， 应 用 程序 会 默认 依赖 于 其 他 的 一 些 包 是 否 是 Python 安装 程序 的 一 部 分 。 
其 中 一 种 实现 是 最 优 的 ， 另外 一 种 实现 可 能 是 备用 计划 。 一 种 常用 的 技术 是 尝试 多 个 import 的 备 
选 包 来 定位 某 个 已 安装 的 包 。 当 配置 可 能 存在 问题 时 ， 我 们 可 以 通过 生成 警告 信息 的 方式 来 显示 这 
些 问 题 。 下 面 是 管理 这 种 可 选 的 一 种 实现 方法 。 

































































































































































































































































































































































































































































import warnings 
try.: 
import simulation model 1 as model 





except lmportError as e: 
warnings.warn( e ) 
If "modqel' not in globals (): 


ty 


import simulation model 2 as model 


except ImportError as e: 


if 


raise ImportError!( 


我 们 尝试 一 个 模块 执行 一 次 

















warnings.warn( e ) 


"model' 

















not in globals () : 
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本 
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"Missing Simulation model 1 and simulation model 2" ) 


入 ,如 果 尝 试 失败 ,我 们 会 尝试 导入 另 一 个 模块 ,我 们 用 if 语 
名 来 减少 内 嵌 的 异常 。 如 果 选 择 多 于 两 种 ， 内 航 的 录 和 常会 形成 一 个 看 起 来 非常 复杂 的 异常 。 通 







































































过 使 用 额外 的 证 语句， 我 们 可 以 平行 化 一 系列 的 候选 项 ， 这 样 就 不 会 有 内 藤 的 异常 了 。 

我 们 可 以 通过 改变 消息 的 类 型 来 更 好 地 管理 这 种 警告 信息 。 在 前 面 的 代码 中 ， 这 就 是 
UserWarning。 这 些 信息 默认 都 会 显示 ， 这 样 就 可 以 向 用 户 证 明 现 在 的 配置 不 是 最 优 的 。 

如 果 我 们 将 类 型 改变 为 Importwarning， 默 认 情 况 下 就 不 会 显示 警告 信息 。 当 选择 不 同 的 
包 不 会 对 用 户 造 成 影响 时 ， 这 种 类 型 提供 了 一 种 通用 的 不 显示 警告 的 操作 。 运 行 -Wq 选项 会 显示 
Importwarning 消息 ， 这 是 一 种 典型 的 开发 人 员 会 用 到 的 技术 。 

我 们 可 以 通过 改变 调用 warnings .warn () 的 方式 来 改变 警告 的 类 型 。 

warnings.warn( er ImportWarning ) 

这 行 代 码 把 警告 的 类 型 改 为 默认 不 显示 。 对 于 使 用 -wd 选项 的 开发 人 员 ， 这 些 信息 仍然 是 可 见 的 。 
14.4.3 用 警告 信息 显示 可 能 存在 的 软件 问题 

针对 最 终 用 户 设计 和 警告 信息 的 想法 有 一 些 让 人 费解 : 应 用 程序 到 底 是 正常 工作 还 是 有 问题 ? 这 
些 警告 信息 意味 着 什么 ? 用 户 哪些 地 方 操作 不 当 ? 

于 这 种 潜在 的 歧义 ， 在 用 户 界 面 显 示警 告 信息 不 是 一 个 好 主意 。 要 使 警告 信息 真正 有 用 ， 程 





























E 常 





序 应 该 1 








我 们 不 应 该 强迫 | 





作 或 者 完全 无 法 工作 








二 Th 








j 户 能 够 判断 输出 




















[a 








的 质量 并 决定 这 些 输出 是 否 





。 当 错误 发 生 时 ， 错 误 信 息 应 该 包含 对 有 












































程序 应 该 正常 工作 或 者 完全 无 法 工作 。 





适 




















































































































有 户 处 理 该 问题 的 建议 。 
j， 这 一 点 是 需要 强调 的 。 
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一 个 可 能 不 会 引起 歧义 的 有 关 用 户 和 警告 信 息 的 用 法 是 警告 用 户 输出 是 不 完整 的 。 例 如 ， 应 用 程 
序 可 能 无 法 建立 完整 的 网 络 连接 。 基 本 的 结果 是 正确 的 ， 但 是 其 中 一 个 数据 源 无 法 正常 工作 。 

在 菜 些 情况 下 ， 应 用 程序 执行 的 操作 不 是 用 户 所 请 求 的 ， 但 是 结果 仍然 是 正确 可 用 的 。 在 网 
络 问题 的 例子 中 ， 程 序 会 使 用 一 个 默认 的 行为 来 代 蔡 基于 网 络 资源 的 行为 。 通 常 ， 用 一 些 正确 的 
但 不 完全 符合 用 户 所 请 求 的 来 莹 代 失 败 是 一 种 很 好 的 警告 方式 。 这 种 警告 最 好 通过 logging 的 











可 


问题 。 








WARN 级 别 完 成 ， 而 不 是 warnings 模块 。warnings 模块 4 
能 希望 向 用 户 提 供 更 多 的 





jo 


万。 




















下 面 是 我 们 如 何 使 用 




















个 简 骨 














E 成 的 信息 只 显示 一 次 ， 但 是 我 们 





的 Logger .warn() 在 日 志 ! 














描述 
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七 工 Y 


with urllib.request.urlopen("http://host/resource/", timeout= 30 ) as resource : 
content= json.load (resource) 


except socket.timeout as e: 


self.1log 


content= [] 


如 果 发 生 超时 ， 和 警告 信息 会 写 入 日 志 中 ， 
志 信 息 每 次 都 会 写 入 。 对 了 








空 列表 ， 日 


















































示 一 次 ， 之 后 就 不 会 再 显示 。 


14. 5 


高 级 日 志 
































这 是 
日 志 

















些 重 大 事件 前 最 后 几 个 日 
消息 。 这 有 点 像 将 OS 的 tail 
第 2 种 技术 是 
可 以 用 来 整合 来 自 不 | 








胆 是 程序 仍然 继续 运行 。 











































































































用 日 志 框 架 提供 的 功能 将 日 














几 试 信息 的 更 高 级 技术 。 第 
志 消 息 的 缓冲 区 , 其 
命令 自动 应 | 


目的 是 用 一 个 小 文件 查看 应 用 程 
j 到 完整 的 日 志 输 出 中 。 


程序 中 的 某 个 给 定位 置 ，warnings 模块 的 警告 





资源 的 内 容 会 被 设置 为 
a 
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.warn ("Missing information from http://host/resource") 























生 疗 
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AN 


通 


一 一 最 后 一 些 信 息 和 网 络 目标 地 址 


我 们 会 介绍 两 种 可 以 帮助 提供 更 有 用 的 1 1 种 技术 是 1og tail:， 























序 终 止 前 的 最 后 几 条 









































14.5.1 创建 自动 的 tail 缓冲 区 


log tail 绥 冲 区 是 1ogging 框架 的 一 个 扩展 。 我 们 会 通过 扩展 MemoryHandler 略微 改变 


它 的 行为 。MemoryHandler 内 置 的 行 
当 logging 关闭 时 ， 写 入 所 有 缓冲 


整个 缓冲 区 。 





我 们 会 稍微 修改 第 1 利 

































































和 写 入 模式 。 我 们 会 将 最 老 的 信息 从 缓冲 区 中 移 除 ， 
在 缓冲 区 中 ， 而 不 是 当 缓 冲 区 满 时 写 入 到 另外 一 个 nandler : 





样 做 的 结果 是 会 写 入 1ogging 关闭 之 前 和 错误 发 生 之 前 的 一 些 信息 。 

















我 们 通常 在 














这 样 做 的 


hnandlers 模块 。 


个 更 高 级 别 的 错误 信息 被 记录 前 
目的 是 为 了 当 错 误 发 生 时 会 写 入 缓冲 区 ， 
为 了 能 够 理解 这 个 例子 ， 重 要 的 是 定位 到 


























的 信息 。 

















志 信息 通过 网 络 发 送 给 集 
服务 器 的 日 志 信息 。 我 


























的 日 志 处 理 服务 。 这 种 技术 
门 需要 为 日 志 创建 发 送 者 和 接收 者 。 





为 包括 3 种 写 入 模式 : 当 缓 冲 区 满 时 ， 写 入 到 另 一 个 handlez; 
的 消息 ， 更 重要 的 是 ， 当 某 个 给 定 级 别 的 消息 被 记录 时 ， 写 入 


























， 将 内 存 处 理 程 








其 他 的 信息 仍然 会 留 
， 其 他 两 种 写 入 模式 保持 不 变 。 这 

















字 配 置 为 一 直 缓 冲 消 息 的 状态 。 





Python 的 安装 位 置 ， 详 细 贡 





也 理解 logging. 


基于 TailHandler 类 创建 时 定义 的 容量 ，MemoryHandler 的 这 个 扩展 会 保存 最 后 的 几 条 信息 。 


class TailHandler (logging.handlers.MemoryHandler): 


def shouldFlush(self, record): 


mnmnm 


Check for buffer full or a record at the flushLevel or higher. 


mn nm 


if record.levelno >= self.flushLevel: 
while len(self.buffer) 


self.acquire() 


>= self.capacity: 


return True 
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A 
del self.buffer[0] 
finally: 
Self.release () 
我 们 扩展 了 MemoryHandler， 它 会 累积 日 志 消 息 直 到 超出 设 定 的 容量 。 当 达到 最 大 容量 时 ， 
添加 新 消息 时 会 移 除 旧 消息 。 请 注意 ， 我 们 必须 锁定 数据 结构 允许 多 线程 访问 日 志 。 
如 果 收 到 一 条 特定 级 别 的 消息 ,那么 整个 结构 都 会 写 入 到 目标 处 理 程序 中 。 通 常 ， 这 个 目标 处 
理 程序 是 FileHandler， 为 了 调试 需要 和 技术 支持 ， 这 个 处 理 程序 会 将 消息 写 入 文件 的 尾部 。 
另外 ， 当 logging 关闭 时 ， 最 后 的 一 些 消息 也 会 被 写 入 文件 尾部 。 这 意味 着 程序 正常 结束 ， 
不 需要 调试 或 者 技术 支持 。 
通常 ， 我 们 会 向 这 种 类 型 的 处 理 程序 发 送 一 条 DEBUG 消息 ， 这 样 就 可 以 得 到 很 多 程序 骨 演 的 
细节 。 在 配置 过 程 中 应 该 显示 地 将 级 别 设置 为 DEBUG， 而 不 是 使 用 默认 的 级 别 。 
下 面 是 一 个 使 用 TailHandler 的 配置 。 
version: 1 
disable existing loggers: False 
handlers: 
console: 
class: logging.StreamHandler 
stream: ext://sys.stderr 
formatter: basic 
tail: 
(): _main .TailHandler 
target: cfg://handlers.console 
capacity: 5 
formatters: 
basic: 
style: "{" 
format: "{levelname:s}: {name:s}:{message:s}" 
loggers: 
Lests 
handlers: [taill] 
level: DEBUG 
propagate: False 
root: 
handlers: [console] 
level: INFO 
TailHandler 的 定义 向 我 们 展示 了 logging 其 他 的 一 些 可 配置 功能 ， 它 向 我 们 展示 了 在 配 











置 文件 中 使 用 类 引用 和 其 他 元 素 。 

在 配置 中 ， 我 们 引用 了 一 个 自 定义 类 。 前 
用 了 定义 在 配置 文件 的 nandlers 部 分 ! 
target 指向 的 StreamHandler 使 月 
调试 文件 的 FileHandler。 






















































































的 consol 



































鲁 配 置 文人 


日 sys . stderr。 如 前 

















中 由 
e 处 悍 


的 cgf://handlers.console 文本 引 
E 程 的 ， 我 们 让 tail 的 


Ee 序 。 出 于 演示 目 
所 述 ， 另 外 一 种 可 能 的 设计 是 使 用 指向 
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我 们 为 使 用 tail 处 理 程序 的 日 志 记录 器 创建 了 test 层次 结构 。 写 入 到 这 些 日 志 记 录 器 中 的 
消息 会 被 缓存 ， 只 有 在 发 生 错误 或 者 logging 关闭 时 才 会 显示 。 
下 面 是 一 个 演示 脚本 。 


logging.config.dictConfig( yaml.load(config8) ) 
































log= logging.getLogger( "test.demo8" ) 
print( "Last 5 before error" ) 
for i in range (20): 

log.debug( "Message {:d}".format (i) ) 
log.error( "Error causes dump of last 5" ) 
print( "Last 5 before shutdown" ) 
for i in range (20,40): 

log.debug( "Message {:d}".format (i) ) 
logging.shutdown () 


在 错误 发 生前 ， 我 们 生成 了 20 条 消息 。 然 后 ， 在 关闭 logging 和 有 刷新 缓存 区 前 我 们 又 生成 
了 20 条 消息 。 这 段 脚本 会 产生 类 似 下 面 这 样 的 输出 。 


Last 5 before error 


























DEBUG:test.demo8:Message 16 
DEBUG:test.demo8:Message 17 
DEBUG:test.demo8:Message 18 
DEBUG:test.demo8:Message 19 
ERROR:test.demo8:Error causes dump of last 5 
Last 5 before shutdown 
DEBUG:test.demo8:Message 36 
DEBUG:test.demo8:Message 37 
DEBUG:test.demo8:Message 38 
DEBUG:test.demo8:Message 39 





























+ 


tail 处 理 程序 默认 忽略 中 介 消 息 。 由 于 设置 的 最 大 容量 是 5， 
logging) 之 前 的 最 后 5 条 消息 会 被 显示 。 


14.5.2 发 送 日 志 消 息 到 远程 的 进程 


一 种 高 性 能 的 设计 模式 是 用 多 个 进程 处 理 一 个 单一 的 问题 。 我 们 的 应 用 程序 可 能 部 署 在 多 个 应 
用 程序 服务 器 上 或 者 是 使 用 多 个 数据 库 客户 端 。 对 于 这 种 架构 ， 我 们 通常 希望 为 不 同 进程 提供 集中 
的 日 志 处 理 机 制 。 
用 来 创建 统一 日 志 的 一 种 技术 是 包含 准确 的 时 间 恰 , 然后 将 来 自 多 个 日 志文 件 的 记录 整理 为 一 
个 统一 的 日 志 。 通 过 远程 地 从 多 个 并 发 的 生产 者 进程 将 日 志 记 录 到 一 个 消费 者 进程 ， 就 可 以 避免 分 
类 和 整合 这 些 额 外 的 处 理 过 程 。 

我 们 的 共享 日 志 解 决 方案 会 使 用 multiprocessing 的 共享 日 志 。 更 多 关于 多 进程 的 信息 ， 参 
见 第 12 章 “ 传 输 和 共享 对 象 ”。 

建立 多 进程 应 用 程序 需要 3 个 步骤 。 











此 错误 发 生 (或 者 关闭 
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首先 ， 创 建 共享 队列 对 象 ， 这 样 一 来 日 志 消 费 者 就 可 以 筛选 消息 。 
其 次 ， 创 建 从 队列 中 获取 日 志 记录 的 消费 者 进程 。 
最 后 ， 我 们 会 创建 用 于 处 理 真 正 应 用 程序 工作 的 生产 者 进程 池 ， 这 些 进程 会 将 记录 写 入 共 
享 队列 。 
ERROR 和 FATAL 消息 可 以 通过 SMS 和 E-mail 向 关心 它们 的 用 户 提供 即时 通知 。 消 费 者 也 可 
以 以 相对 慢 的 速度 处 理 和 整合 日 志文 件 有 关 的 工作 。 
创建 生产 者 和 消费 者 的 顶层 父 应 用 程序 和 Linux 中 启动 多 个 OS 级 别 进程 的 init 程序 类 似 。 如 
果 我 们 使 用 和 init 一 样 的 设计 模式 ， 那 么 父 应 用 程序 可 以 监视 多 个 子 生产 者 程序 ， 观 察 它们 是 否 崩 
演 。 同 时 ， 它 也 可 以 记录 相关 的 错误 甚至 尝试 重启 程序 。 
下 面 是 消费 者 进程 的 定义 。 


import collections 
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import logging 

import multiprocessing 

class Log Consumer 1 (multiprocessing.Process): 

"""In effect, an instance of QueueListener.™"" 
def _init ( self, queue ): 
self.source= queue 
super(). init () 
logging.config.dictConfig( yaml.load(consumer config) ) 
self.combined= logging.getLogger!\ 

"combined." + self. class . qualname  ) 
self.log= logging.getLogger( self. class . qualname  ) 
self.counts= collections.Counter() 

def run( self ) : 


self.log.info( "Consumer Started" ) 





while True: 
log record= self.source.get() 
if log record == None: break 
self.combined.handle( log record ) 
words= log record.getMessage() .split() 
self.counts[words[1]] += 1 
self.log.info( "Consumer Finished" ) 
self.log.info( self.counts ) 


























这 个 进程 是 multiprocessing.Process 的 子 类 , 我 们 会 用 start () 方法 启动 它 ， 基 类 会 启 
动 一 个 子 进程 运行 run () 方法 。 

当 进 程 运 行 时 ， 它 会 从 队列 中 获取 日 志 记 录 并 将 它们 转发 给 一 个 日 志 记 录 器 实例 。 在 本 例 中 ， 
我 们 会 创建 一 个 特殊 的 日 志 记 录 器 ， 它 会 以 父 类 的 名 字 combined .命名 ， 源 进程 中 的 所 有 记录 
都 会 写 入 这 个 日 志 记录 器 。 

另外 ， 基 于 每 条 信息 的 第 2 个 单词 ， 我 们 会 提供 一 些 计 数 信 息 。 在 本 例 中 ， 我 们 已 经 将 信息 文 
的 第 2 个 单词 设计 为 进程 的 ID 号码。 这 个 计数 会 向 我 们 展示 有 多 少 条 信息 被 成 功 处 理 过 。 
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志 记 录 器 。 它 将 处 理 程 序 的 列表 设置 为 QueueHandler, 它 只 是 对 oueue 的 一 个 封装 实例 ， 这 个 日 
志 记 录 器 的 级 别 被 设 定 为 INFO。 
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下 面 是 一 个 为 这 个 过 程 创 建 的 配置 文件 。 


version: 1 











disable existing loggers: False 
handlers: 
console: 
class: logging.StreamHandler 
stream: ext://sys.stderr 
formatter: basic 
formatters: 
Dasie: 
style: "{" 
format: "{levelname:s}: {name:s}:{message:s}" 
loggers: 
combined: 
handlers: [ console |] 
formatter: detail 
level: INFO 
propagate: False 
root: 
handlers: [ console |] 
level: INFO 























我 们 使 用 基本 格式 定义 了 简单 的 命令 行 Logger, 也 用 combined. 为 开头 的 名 字 定 义 了 记录 器 
结构 的 顶层 。 这 些 记 录 器 会 被 用 于 显示 合并 后 的 来 自 于 多 个 生产 者 的 输出 。 
下 面 是 日 志 生 产 者 。 
































让 
























































class Log Producer (multiprocessing.Process): 
handler class= logging.handlers.QueueHandler 
def _init ( self, proc id, queue ) : 
self.proc id= proc id 
self.destination= queue 


super(). init () 

self.log= logging.getLogger( 
"{0}.{1}".format (self. class . qualname , self.proc id) ) 

self.log.handlers = [ self.handler class( self.destination ) ] 


self.log.setLevel( logging .INFO ) 
def run( self ): 
self.log.info( "Producer {0} Started".format (self.proc id) ) 
for i in range (100): 
self.log.info( "Producer {:d} Message {:d}".format (self. 
Proc lgdy Td) 3 
self.log.info( "Producer {0} Finished".format (self.proc id) ) 


生产 者 没有 做 太 多 配置 。 它 只 是 简单 地 用 类 全 名 和 实例 标识 符 (self .proc_ig) 获取 一 个 日 














































































































我 们 将 handler_class 定义 为 类 的 一 个 属性 ， 





+ 

















为 我 们 计划 改变 它 。 对 于 第 1 个 例子 而 言 ， 


14.5 ”高 级 日 志 一 一 最 后 一 些 信息 和 网 络 目标 地 址 ”345 














它 会 是 logging.handlers .QueueHandler。 对 于 后 一 个 例子 而 言 ， 我 们 会 使 用 另外 一 个 类 。 
真正 完成 这 个 工作 的 进程 会 用 这 个 日 志 记 录 器 创建 日 志 信息 。 这 些 信 息 会 加 入 队列 中 ， 等 待 中 
央 消 费 者 处 理 。 在 本 例 中 ， 这 个 进程 简单 地 用 最 快 的 速度 清空 缓冲 区 中 的 102 条 消息 。 

下 面 是 我 们 如 何 启动 消费 者 和 生产 者 ， 我 们 会 用 一 些小 步骤 展示 这 个 过 程 。 首 先 ， 我 们 创建 
队列 。 


Import multiprocessing 
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Se 

















queue= multiprocessing.Queue (100) 








这 个 队列 太 小 ， 无 法 在 瞬间 清空 10 个 生产 者 的 102 条 信息 。 这 里 用 小 队列 的 原因 是 当 消 息 丢 失 
时 可 以 查看 原因 ， 下 面 是 如 何 启动 消费 者 进程 的 代码 。 















































consumer = Log Consumer 1( queue ) 
consumer.start () 


下 面 是 我 们 如 何 启动 生产 者 进程 数组 。 


producers = [] 














for i in range(10): 
proc= Log Producer( i, queue ) 
proc.start () 
producers.append( proc ) 








和 我 们 预期 的 一 样 ，10 个 并 发 的 生产 者 将 会 让 队列 溢出 。 每 个 生产 者 都 会 收 到 一 些 队列 慢 的 

异常 ， 这 些 异常 就 意味 着 消息 丢失 了 。 
下 面 是 我 们 如 何 正确 地 结束 这 个 处 理 过 程 。 
for p in producers: 


p.join() 
queue.put( None ) 

































































consumer .join () 









































首先 ， 我 们 等 待 每 个 生产 者 进程 结束 ， 然 后 加 入 父 进程 。 其 次 ， 我 们 将 一 个 哨兵 对 象 插入 队列 
， 这 样 消费 者 进程 就 会 正确 结束 。 最 后 ， 我 们 等 待 消费 者 进程 结束 并 加 入 父 进程 。 


14.5.3 ”防止 队列 溢出 
日 志 模 块 默 认 的 行为 是 用 Queue .put_nowait () 方法 将 信息 插入 队列 中 。 这 么 做 的 优点 是 允 
午 生 产 者 的 运行 不 受 记录 日 志 带 来 的 延迟 影响 。 这样 做 的 缺点 是 , 在 最 坏 情 况 下 ,如果 队 列 太 小 而 无 
法 处 理 大 量 消 入 的 日 志 消 息 ， 那 么 这 些 消 息 就 会 丢失 。 
我 们 有 两 种 方法 能 够 合理 地 处 理 这 种 消息 大 量 涌 入 的 情况 。 
@ 我 们 可 以 把 oueue 换 成 大 小 没有 限制 的 SimpleQueue.SimpleQueue。 由 于 它 的 API 有 
一 些 不 同 ， 我 们 需要 扩展 QueueHandler， 用 Queue .put () 替换 Queue .put_nowait () 。 
@ 当 队 列 满 这 种 少见 的 情形 发 生 时 ， 可 以 减 慢 生 产 者 的 速度 ， 只 需要 稍微 修改 QueueHandler， 
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用 oueue .put () 替代 oueue .put_nowait () 。 
有 趣 的 是 ， 相 同 的 API 修改 可 以 同时 适用 于 Queue 和 Simpleoueue。 下 面 是 修改 的 代码 。 

















class WaitQueueHandler( logging.handlers.QueueHandler ) : 

def enqueue (self, record): 
self.queue.put( record ) 

我 们 用 一 个 不 同 的 oueue 的 方法 替换 了 enaueue () 的 方法 体 。 现 在 ， 我 们 可 以 使 用 
SimpleQueue 或 者 oueue。 如 果 使 用 oueue， 当 队列 满 时 它 会 等 待 ， 从 而 避免 了 丢失 消息 。 如 
果 使 用 SimpleQueue， 队 列 的 尺寸 会 稍微 增 大 来 保存 所 有 的 消息 。 

下 面 是 修改 后 的 生产 者 类 。 


class Log Producer 2 (Log_ Producer): 
handler class= WaitQueueHandler 








































































































这 个 类 使 用 了 我 们 的 新 WaitoueueHandler。 这 个 生产 者 的 其 他 部 分 与 前 面 版 本 相同 。 

其 余 的 用 于 创建 oueue 和 启动 消费 者 的 脚本 保持 不 变 。 生 产 者 都 是 Log_Producer 2 的 实例 ， 

但 是 ， 用 于 启动 和 加 入 的 脚本 与 第 1 个 例子 中 使 用 的 代码 相同 。 
这 个 版 本 运行 得 更 慢 , 但 是 不 会 丢失 任何 消息 ,我 们 可 以 通过 创建 更 大 的 队列 容量 来 提高 性 能 。 

如 果 我 们 创建 可 以 容纳 1020 条 消息 的 队列 ， 那 么 本 例 中 的 性 能 就 会 达到 最 优 。 找 到 一 个 最 优 的 队 

列 容量 需要 进行 仔细 的 实验 。 
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14.6 总 结 











我 们 介绍 了 如 何 使 用 logging 模块 和 更 高 级 的 面向 对 象 设计 技术 。 我 们 创建 了 与 模块 、 类 
实例 和 函数 相关 联 的 日 志 。 我 们 用 装饰 器 创建 日 志 , 这 种 日 志 作 为 一 致 的 横 切 方面 应 用 于 多 个 类 中 。 

我 们 介绍 了 如 何 使 用 warnings 模块 来 显示 配置 有 问题 或 者 方法 已 经 废弃 。 我 们 可 以 将 
warnings 用 于 其 他 目的 , 但 是 必须 注意 滥用 warnings 而 导致 一 种 不 知道 应 用 程序 是 否 正常 工 
作 的 模糊 情况 。 


14.6.1 设计 要 素 和 折 中 方案 


logging 模块 支持 审计 、 调 试 和 一 些 安全 需求 。 我 们 可 以 用 记录 日 志 的 方式 作为 保存 处 理 步 
又 记录 的 简单 方式 。 通 过 选择 性 地 启用 和 禁用 日 志 ， 可 以 为 那些 处 理 真 实 世界 的 数据 时 需要 了 解 代 
码 是 如 何 工 作 的 开发 人 员 提 供 文 持 。 
warnings 模块 支持 调试 和 维护 的 功能 。 我 们 可 以 用 它 提醒 开发 人 员 API 问题 、 配 置 问题 和 殿 
他 潜在 的 漏洞 来 源 。 

当 使 用 logging 模块 时 ， 我 们 会 经 常 创建 大 量 不 同 的 日 志 记 录 器 ， 这 些 记 录 器 都 包含 一 些 
handlers。 我 们 可 以 用 Logger 名 称 的 层次 结构 引入 新 的 或 者 专用 的 日 志 消 息 集合 。 一 个 类 不 能 
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包含 两 个 日 志 记 录 器 是 没有 理由 的 : 因为 一 个 可 以 用 于 审计 ， 另 一 个 可 以 用 于 更 通用 的 调试 。 

我 们 可 以 引入 新 的 日 志 级 别 数字 ,但 是 必须 非常 小 心 。 级 别 可 能 会 混淆 开发 人 员 关 注 的 debug、 
info 和 warning) 信息 和 用 户 关 注 的 (info、error 和 fatal) 信息 。 调 试 消息 中 有 特定 的 一 部 分 不 需要 
一 直 显 示 的 失败 错误 消息 中 。 我 们 可 以 为 详细 信息 或 者 可 能 是 详细 调试 信息 增加 一 个 级 别 ,但 是 这 
已 经 是 关于 级 别 的 所 有 改变 。 

logging 模块 允许 我 们 为 不 同 的 目的 提供 多 个 配置 文件 。 作 为 开发 人 员 ， 我 们 可 以 考虑 用 配置 
文件 将 日 志 级 别 设置 为 DEBUG 以 及 为 开发 中 的 模块 启用 特殊 的 日 志 记录 器 。 对 于 最 后 的 部 署 ， 我 们 
可 以 用 配置 文件 将 日 志 级 别 设置 为 INFO 并 且 为 支持 更 正式 的 审计 或 者 安全 审查 提供 不 同 处 理 程序 。 

我 们 会 包含 Zen of Python 中 的 一 些 思想 。 

错误 永远 不 应 该 被 忽略 。 

除非 是 显 式 地 忽略 。 

warnings 和 logging 模块 直接 支持 这 种 想法 。 

这 些 模块 更 倾向 于 全 局 的 质量 , 而 不 是 问题 的 特定 解决 方案 。 它 们 允许 我 们 通过 比较 简单 的 编 
程 获 得 一 致 性 。 随 着 我 们 的 面向 对 象 设计 变 得 更 大 、 更 复杂 ， 我 们 可 以 更 专注 于 待 解决 的 问题 ， 而 
不 用 浪费 时 间 考 虑 基础 架构 的 问题 。 此 外 ， 这 些 模块 允许 我 们 修改 输出 ， 为 开发 人 员 或 者 用 户 提 供 
有 用 的 信息 。 


14.6.2 ”展望 


在 后 面 的 章节 中 , 我 们 会 介绍 可 测试 性 以 及 如 何 使 用 unittest 和 goctest 模块 。 自动化 测 
试 是 软件 的 基本 要 求 ， 在 自动 化 测试 提供 足够 的 证 据 向 我 们 展示 代码 正常 工作 之 前 ， 都 不 应 该 认 
为 编码 工作 已 经 完成 。 我 们 会 介绍 一 些 更 容易 测试 的 面向 对 象 的 设计 技术 。 























































































































































































































































































































































































































































































































































































































第 15 章 
可 测试 性 的 设计 








高 质量 的 程序 必须 写 自动 化 测试 ， 需 要 尽 最 大 的 努力 来 确保 软件 是 工作 的 。 黄 金 法 则 是 为 了 可 

交付 性 ， 功 能 必须 包含 单元 测试 。 

没有 自动 化 测试 的 情况 下 ， 功 能 就 不 能 被 确保 是 工作 的 并 且 不 应 该 被 使 用 。 正 如 Kent 
Beck 在 极限 编程 中 所 提 到 的 :“ 任 何 没 有 经 过 自动 测试 的 功能 就 等 于 不 存在 的 功能 ”。 

关于 程序 功能 的 自动 化 测试 ， 有 两 个 基本 点 。 

@ 自动化: 这 意味 着 没有 人 工 的 评审 工作 。 测 试 包含 了 一 个 脚本 ， 用 于 对 比 实际 结果 和 期 望 

的 结 

@ 功能 : 它们 会 被 隔离 进行 测试 ， 来 确保 可 以 独立 工作 。 这 是 单元 测试 ， 意 味 着 每 个 单元 ! 

包含 了 足够 的 信息 来 实现 指定 功能 。 理 想 情 况 下 ， 它 是 很 小 的 单元 ， 例 如 一 个 类 。 然 而 ， 

也 可 以 是 更 大 的 单元 ， 例 如 模块 或 者 包 。 

在 Python 中 内 置 了 两 个 测试 框架 ,简化 了 自动 化 测试 的 编码 。 接 下 来 会 介绍 如 何 使 用 doctest 

和 unittest 来 做 自动 化 测试 。 为 了 使 测试 更 实用 , 会 介绍 几 点 在 单元 测试 时 需要 考虑 到 的 地 方 。 

有 关 更 详细 的 内 容 ， 可 以 阅读 ottinger 和 Langr 的 FIRST (Fast Isolated Repeatable 

Self-validating Timely) 特性 ， 速度 快 、 隔 离 、 可 重复 、 自 我 验证 和 及 时 。 大 多 数 情 况 下 ， 可 重复 和 自 

我 验证 需要 一 个 自动 化 测试 框架 。 及 时 意味 着 测试 的 编写 要 早 于 被 测试 的 代码 。 参 见 http://pragprog. 


com/magazines/2012-01/unit-tests-are-first。 




























































































































































































































































































































































































































































































15.1 ”为 测试 定义 并 隔离 单元 








Cs 





丸 为 测试 是 基本 的 , 可 测试 性 在 设计 的 考虑 过 程 中 是 一 个 重要 的 环节 。 设计 也 必须 要 支持 测试 
和 调试 ， 因 为 不 使 用 的 类 是 没有 价值 的 。 一 个 类 需要 被 证 明 是 可 以 工作 的 ， 这 一 点 是 很 重要 的 。 
理想 情况 下 ， 会 希望 有 一 个 测试 的 层次 结构 。 最 底层 是 单元 测试 。 在 这 里 ， 我 们 对 每 个 类 或 函 
数 进行 隔离 测试 是 为 了 确保 它 符合 API 的 标准 。 每 个 类 或 函数 在 测试 中 都 是 一 个 单元 。 在 单元 测试 
上 面 是 集成 测试 。 一 旦 可 以 确定 每 个 类 或 函数 是 可 以 独立 工作 的 ， 就 可 以 对 一 组 类 进行 测试 。 也 可 
以 测试 整个 模块 和 整个 包 。 完 成 集成 测试 之 后 ， 就 可 以 对 整个 应 用 进行 自动 化 测试 。 

















六 | 









































































































































































































































15.1 为 





这 并 不 是 有 关 测试 的 所 有 种 类 ， 还 可 以 做 性 能 测试 以 及 安全 漏洞 测试 
自动 化 测试 ， 因 为 它 是 整个 应 用 的 重心 。 测 试 的 层次 结构 揭示 了 很 重要 的 复 
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。 然 而 ， 我 们 会 重点 关注 
杂 性 。 对 于 类 或 一 组 类 的 














测试 用 例 的 定义 可 以 是 非常 狭义 的 。 随 着 向 集成 测试 中 添加 更 多 的 单元 ， 输 入 的 值 域 也 增加 了 。 妆 
尝试 对 整个 应 用 进行 测试 时 ， 手 动 操 作成 为 了 一 个 可 选 的 输入 ， 包 括 在 测试 过 程 中 关闭 设备 、 拔 出 





























电源 ， 或 是 将 桌子 上 的 东西 推 下 去 ， 看 一 下 当 设 备 掉 在 距离 桌面 3 英尺 的 硬 地 板 上 时 一 切 是 否 仍 然 









































正常 。 由 于 可 能 的 场景 非常 多 ， 因 此 使 得 应 用 完全 做 到 自动 化 测试 是 非常 
我 们 会 重点 关注 最 容易 实现 自动 化 测试 的 方式 。 只 有 完成 了 单元 测试 
统 才 有 可 能 正常 运行 。 


15.1.1 最 小 化 依赖 
















































































困难 的 。 








， 在 更 大 的 持续 集成 的 系 


在 设计 类 时 ， 必 须要 考虑 到 类 的 依赖 关系 : 它 所 依赖 的 类 和 依赖 于 它 的 类 。 为 了 简化 类 定义 的 











测试 ， 需 要 将 它 从 依赖 的 类 中 隔离 出 来 。 
































以 Deck 类 为 例 ， 它 依赖 于 card 类 。 我 们 可 以 很 容易 地 将 cara 类 隔离 出 来 进行 测试 ， 但 是 





当 需 要 对 Deck 类 进行 测试 时 ， 需 要 将 它 对 card 类 的 依赖 拿 掉 。 
以 下 是 一 个 carq 类 的 定义 ， 在 之 前 介绍 过 了 。 








class Card: 
def init ( self, rank, suit, hard=None, soft=None ) : 
self.rank= rank 
self.suit= suit 
self.hard= hard or int (rank) 
self.soft= soft or int (rank) 
def str ( self ): 
return "“{0.rank!s}{0.suit!s}".format (self) 
class AceCard( Card ): 


def init ( self, rank, suit ): 
super(). init ( rank, suit, 1, 11 ) 
class FaceCard( Card ): 
def init ( self, rank, suit ) : 
super(). init ( rank, suit, 10, 10 ) 















































试 ， 因 为 它们 只 包含 了 两 个 方法 和 4 个 属性 。 
J 以 (错误 ) 定义 一 个 Deck 类 ， 包 


Suits = '%', ' 信 ', 'Y', '4! 
Class Deckl( list ) : 





| 





def init ( self, size=l1 ): 
super(). init  () 
self.rng= random.Random() 
for d in range (size): 
fo0r :Ss i SUuitss 
cards = ([AceCard(1, s)] 








可 以 看 到 这 些 类 中 的 每 一 个 都 有 一 个 直接 的 继承 层次 结构 。 每 个 类 都 可 以 被 隔离 出 来 进行 测 


+ [Cardl(r, s) for r in range(2, 12)] 
+ [FaceCardl(r, s) for r in range(12, 14)]) 
super() .extend( cards ) 

self.rng.shuffle( self ) 


以 上 设计 有 两 点 缺陷 。 首先 , 它 与 Card 类 层次 结构 中 的 3 个 类 是 紧 耦 合 的 。 无 法 将 Deck 从 card 
分 离 出 来 做 单元 测试 。 其 次 ， 它 依赖 于 随机 数 生成 器 ， 不 是 一 个 可 重复 的 测试 。 
一 方面 ，card 是 一 个 非常 简单 的 类 ， 可 以 很 容易 将 Deck 以 及 所 包含 的 card 一 起 测试 。 
男 一 方面 ， 可 能 会 想 重 用 扑克 牌 或 者 皮 纳 克 尔 牌 ， 它 们 在 21 点 游戏 中 有 不 同 的 行为 。 
里 想 情况 下 , 可 以 使 Deck 独立 于 任何 Card 的 实现 。 如 果 做 到 了 这 一 点 ,就 能 够 在 不 依赖 cardq 
实现 的 前 提 下 ， 对 Deck 进行 测试 ， 也 可 以 对 任何 card 与 Deck 的 组 合 情 况 进行 测试 。 
以 下 实现 使 用 了 工厂 函数 ， 是 一 种 比较 好 的 解 耦 方式 。 


def card( rank, suit ) : 




























































































































































































































































































if rank == 1: return AceCard( rank, suit ) 
elif 2 <= rank < 11: return Card( rank, suit ) 
elif 11 <= rank < 14: return FaceCard( rank, suit ) 





else: raise Exception( "LogicError" ) 
card () 函数 会 基于 传 入 的 rank 值 完成 Card 子 类 的 创建 。 这 样 一 来 ，Deck 类 就 可 以 使 用 这 个 
函数 来 完成 创建 card 实例 的 过 程 。 我 们 通过 插入 一 个 中 间 函 数 将 两 个 类 的 定义 分 离 。 
还 有 其 他 用 于 将 card 类 从 Deck 类 解 看 的 方式 。 可 以 对 工厂 函数 进行 重 构 ， 将 它 变 成 Deck 
类 的 方法 。 也 可 以 通过 使 用 类 级 别 的 属性 ， 或 初始 化 方法 参数 的 方式 将 类 名 独立 出 来 进行 绑 定 。 
在 以 下 这 个 例子 中 ， 在 初始 化 方法 中 使 用 了 复杂 的 绑 定 来 代替 工厂 函数 。 


class Deck2( list ) : 
def _ init ( self, size=1, 
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Se 























random=random.Random(), 
ace class=AceCard, card class=Card, face class=FaceCard ): 
super(). init () 
self.rng= random 
for d in range (size): 
£0F Ss: 二 旋 SUIt Ss: 


cards = ([ace class(1, s)] 
+ [ card class(r, s) for r in range(2, 12) | 
+ [ face class(r, s) for r in range(12, 14) ] ) 


super() .extend( cards ) 
self.rng.shuffle( self ) 


然而 ， 这 个 初始 化 过 程 有 些 多 余 ，Deck 类 并 没有 与 Card 类 的 层次 结构 或 是 特殊 的 随机 数 生成 
器 存在 耦合 。 为 了 可 测试 性 ， 可 以 提供 一 个 包含 了 已 知 种 子 的 随机 数 生成 器 。 也 可 以 使 用 其 他 用 了 
简化 测试 的 类 例如 tuple) 来 蔡 代 card 类 的 相关 定义 。 

在 下 一 节 中 ， 我 们 会 重点 关注 另 一 种 Deck 类 的 实现 。 它 将 使 用 carq () 工厂 函数 。 在 工厂 函数 中 ， 
封装 了 card 层次 结构 的 绑 定 并 使 用 了 一 些 规 则 ， 根 据 rank 将 card 类 分 离 出 来 ， 可 以 单独 测试 。 
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15.1.2 创建 简单 的 单元 测试 


我 们 将 对 card 类 层次 结构 和 card () 工厂 函数 创建 一 些 简 单 的 单元 测试 。 
于 card 的 相关 类 都 很 简单 ， 因 此 没有 必要 对 它们 过 度 地 进行 测试 。 总 存在 一 种 不 会 太 复杂 
的 方式 。 如 果 盲 目地 进行 测试 驱动 开发 ， 在 开发 过 程 中 就 需要 为 一 个 只 包含 了 几 个 简单 的 属性 和 方 
法 的 类 写 很 多 没 必要 的 单元 测试 。 
测试 驱动 开发 只 是 一 个 建议 ， 而 3 
考 就 必须 要 遵从 的 一 种 规则 。 
有 几 种 关于 测试 方法 命名 的 方式 。 我 们 会 
格 。 关 于 这 种 命名 方式 有 以 下 3 种 写法 。 
@ 可 以 使 用 _should 将 命名 分 为 两 个 部 分 ， 例 如 StateUnderTest_shoul1q_Expected 
Behavior， 包 含 了 状态 和 结果 。 我 们 将 重点 关注 这 种 方式 。 
@ 可 以 使 用 由 when 和 _should 组 成 的 包含 两 个 部 分 的 名 称 ， 例 如 when_State 
UnderTest_should ExpectedBehavior, 也 是 包含 了 状态 和 结果 , 但 是 使 用 了 更 多 的 
命名 语法 。 
@ 可 以 使 用 一 个 包含 了 3 个 部 分 的 名 称 ，UnitOfWork StateUnderTest Expected 
Behavior。 它 结合 了 要 测试 的 工作 单元 进行 说 明 ， 在 读 测试 日 志 时 会 很 有 用 。 
更 多 信息 ， 可 以 参考 http://osherove.com/blog/2005/4/3/mamingstandards-for-unit-tests.html。 
可 以 通过 对 unittest 模块 进行 配置 来 使 用 不 同 的 模式 对 测试 方法 进行 查找 。 可 以 将 它 配 置 
为 查找 when_。 可 以 简单 地 使 用 内 置 的 查找 模式 ， 将 所 有 的 测试 方法 名 以 test 开头 。 
以 下 是 card 类 的 一 个 测试 方法 示例 。 
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点 关注 一 种 包含 了 测试 条 件 和 期 望 结果 的 命名 风 























































































































































































































pA 

























































































class TestCard( unittest.TestCase ) : 
def setUp( self ): 
self.three clubs= Card( 3, '®' ) 
def test should returnStr( self ) : 





self.assertEqual( "3%", str(self.three clubs) ) 
def test should getAttrValues( self ): 
self.assertEqual( 3, self.three clubs.rank ) 
fs ( "®", self.three clubs.suit ) 
self.assertEqual( 3, self.three clubs.hard ) 
上 ( 3, self.three clubs.soft ) 


我 们 定义 了 一 个 测试 方法 setUp () ， 创 建 了 一 个 被 测试 类 的 对 象 ， 也 为 这 个 对 象 定义 了 两 个 
测试 。 因 为 这 里 没有 实际 的 交互 ， 在 测试 名 称 中 也 没有 包含 测试 的 状态 。 它 们 的 行为 非常 简单 ， 应 
该 总 是 工作 的 。 

有 些 人 会 质疑 这 样 做 有 些 过 度 测 试 了 ， 因 为 测试 代码 多 于 应 用 程序 代码 。 答 案 是 不 会 ， 因 为 它 没 


self.assertEqual 





self.assertEqual 
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有 过 度 。 实 际 上 并 没有 一 种 规定 ， 要 求 应 用 程序 代码 要 比 测试 代码 多 。 而 事实 上 ， 这 样 的 对 比 是 没有 
意义 的 。 重 要 的 是 ， 即 使 很 小 的 类 可 能 都 会 有 bug。 
只 是 对 属性 值 进行 测试 并 没有 测试 到 类 的 逻辑 。 正 如 在 之 前 的 例子 中 所 看 到 的 ， 关于 测试 属性 
值 有 两 种 观点 。 
@ 从 黑 盒 的 角度 来 看 ， 我 们 应 该 忽视 实现 。 这 样 的 话 ， 需 要 对 所 有 的 属性 进行 测试 。 而 在 属 
性 中 ， 有 些 有 可 能 是 特性 ， 也 应 该 被 测试 。 
@ 从 白 盒 的 角度 来 看 ， 可 以 对 实现 细节 进行 验证 。 如 果 打算 这 样 测 试 ， 可 能 需要 稍微 琢磨 一 
下 哪些 属性 该 被 测试 。 例 如 ，suit 属性 就 不 需要 太 多 的 测试 。 而 对 于 hard 和 soft 属 
性 ， 需 要 多 一 些 的 测试 。 
有 关 更 多 信息 ， 可 以 参见 http://en.wikipedia.org/wiki/White-box_testing 和 http://en.wikipedia.org/ wiki/ 
Black-box testing。 
当然 , 还 需要 对 Carq 类 层次 结构 中 的 其 余部 分 进行 测试 , 这 里 只 演示 Acecarq 这 个 测试 用 例 。 
介绍 完 这 个 例子 ，FaceCard 这 个 测试 用 例 也 应 该 清楚 了 。 
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class TestAceCard( unittest.TestCase ) : 

def setUp( self ): 
self.ace spades= AceCard( 1, '@' ) 

def test should returnStr( self ) : 
self.assertEqual( "A@", str(self.ace spades) ) 

def test should getAttrValues( self ): 
self.assertEqual( 1, self.ace spades.rank ) 
sel 





lf.assertEqual( "%", self.ace spades.suit ) 
self.assertEqual( 1, self.ace spades.hard ) 
Lf ( 


Se] assertEqual( 11, self.ace spades.soft ) 



































在 这 个 测试 用 例 中 ， 也 先 创建 了 一 个 card 实例 ， 这 样 就 可 以 测试 字符 串 输出 
每 个 属性 都 进行 了 检查 。 
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15.1.3 ”创建 一 个 测试 组 件 


定义 一 个 测试 组 件 通常 是 有 用 



































的 。 默 认 情 况 下 ， 会 使 用 unittest 包 来 对 测试 进行 搜索 。 当 在 多 
个 测试 模块 中 对 测试 进行 收集 时 ， 最 好 在 每 个 测试 模块 中 都 定义 一 个 测试 组 件 。 如 果 每 个 模块 都 定 
义 了 一 个 suite () 函数 ， 就 可 以 使 用 各 个 模块 中 定义 的 suite () 函数 来 进行 测试 的 查找 操作 。 
而 且 ， 如 果 要 自 定义 一 个 TestRunner， 也 需要 使 用 一 个 测试 组 件 ， 可 以 使 用 如 下 代码 来 执行 测试 。 


def suite2(): 
s= unittest .TestSuite() 











































































































load from= unittest.defaultTestLoader.loadTestsFromTestCase 
s.addTests( load from(TestCard) ) 

s.addTests( load from(TestAceCard) ) 

s.addTests( load from(TestFaceCard) ) 

return s 
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我 们 先 基 于 3 个 Testcases 类 的 定义 创建 了 一 个 测试 组 件 ， 然 后 将 它 传 入 unittest . 
TextTestRunner () 实例 。 在 unittest 中 我 们 使 用 了 默认 的 TestLoader。TestLoagder 先 对 
TestCase 类 进行 扫描 ， 找 出 所 有 的 测试 方法 。TestLoader .testMethodPrefix 的 值 为 test， 
这 是 查找 类 中 测试 方法 的 匹配 方式 ， 加 载 器 使 用 方法 名 来 创建 测试 对 象 。 

有 两 种 方式 来 使 用 Testcases， 其 中 基于 TestCcase 的 命名 方法 使 用 TestLoagder 来 创建 
测试 用 例 是 其 中 一 种 。 在 接 下 来 的 节 中 ,会 介绍 手动 创建 Testcase 实例 。 在 这 里 的 例子 中 ,我 们 
不 会 依赖 TestLoader。 可 使 用 以 下 代码 来 运行 测试 组 件 。 


if name == " main ": 








lp 













































































































































































t= unittest.TextTestRunner () 
t.run( suite2() ) 


可 以 看 到 如 下 输出 : 


Fe 





LL 








FAIL: test should returnStr ( main .TestAceCard) 





Traceback (most recent call last): 
File "p3 cl5.py", line 80, in test should returnstr 
self.assertEqual( "A@", str(self.ace spades) ) 














AssertionError: 'A@' != '1@! 

一 AAA 

+ 1 

FAIL: test should _ returnStr ( main .TestFaceCard) 





Traceback (most recent call last): 
File "p3 cl5.py", line 91, in test should returnSsStr 
self.assertEqual( "Qv¥", str(self.queen hearts) ) 








AssertionError: 'Q¥' != '12Y¥' 


+ 129 





Ran 6 tests in 0.001s 


FAILED (failures=2) 

TestLoader 类 分 别 为 每 一 个 TestCase 类 创建 了 两 个 测试 ， 一 共 0 个 测试 。 测试 名 称 即 
方法 名 称 ， 以 test 开头 。 

这 里 有 个 很 明显 的 问题 。 测 试 所 提供 的 期 望 结 果 与 类 定义 并 没有 匹配 。 需 要 为 card 的 
相关 类 做 一 些 开 发 工作 来 通过 这 个 组 件 的 测试 。 关 于 这 个 bug 的 修改 ， 留 给 读者 来 完成 。 
15.1.4 包含 边界 值 测试 


当 需 要 对 Deck 类 整体 进行 测试 时 ， 需 要 保证 几 点 : 履 盖 到 了 所 有 需要 用 到 的 Cards 类 ， 并 且 被 
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正确 洗 脾 了 。 这 里 3 
是 Python 内 置 的 ， 
我 们 希望 测试 








不 需要 对 出 牌 进行 测试 ， 因 为 会 依赖 于 1ist 和 1ist .pop() 方 法 。 因 为 它们 
所 以 不 需要 额外 的 测试 。 
Deck 类 的 创建 和 洗 牌 过 程 ， 独 立 于 任何 card 类 层次 结构 。 如 之 前 提 到 的 ， 可 












































以 使 用 一 个 工厂 方法 来 对 Deck 和 cara 的 定义 进行 解 耦 。 工 三 方法 的 添加 会 需要 更 多 的 测试 。 如 





果 考 虑 一 下 之 前 在 Card 类 层次 结构 中 找 出 的 bug， 就 可 以 看 出 这 并 不 是 坏事 。 




















以 下 是 工厂 函数 的 一 个 测试 。 


class TestCardFactory( unittest.TestCase ): 





def test rankl should createAceCard( self ) : 


c = 
self 


card( 1, '%' ) 
.assertIsInstance( c, AceCard ) 


def test rank2 should createCard( self ) : 


c = 
self 
def test 


card( 2, '$' ) 
.assertIsInstance( c, Card 


rank10_ should createCard( self ) : 





c = 
self 
def 七 es 七 


card( 10，'9' ) 
.dassertIsInstance( c, Card 


rank10_ should createFaceCard( self ): 





self 
def test 


card( 11, '' ) 
.assertIisInstance( Cr Card 














rank13 should createFaceCard!( self ): 








self 











card( 13, '®' ) 
.assertIisInstance( cr Card ) 








def test otherRank should exception( self ) : 


with 


with 











self.assertRaises( LogicError ): 

c = card(14, ' 信 ') 
self.assertRaises( LogicError ) : 
c= card(0, ' 全 ') 






































我 们 没有 对 所 有 13 种 牌 面 值 进 行 测试 ， 因 为 从 2 到 10 可 以 看 作 是 同样 的 情况 。 而 我 们 所 做 的 ， 


正 是 结合 了 Boris 

















Beizer 的 建议 。 





Bug 隐藏 在 角落 里 ， 并 聚集 在 边界 。 











测试 用 例 
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应 该 包含 纸牌 的 所 有 边界 值 。 因 此 ， 需 要 对 牌 面 值 1、2、10、11 和 13， 以 及 不 合 
法 的 0 和 14 进行 测试 。 其 中 包括 了 牌 面值 的 最 大 值 和 最 小 值 的 ; 
值 分 别 设 计 了 一 个 测试 用 例 。 



























































PN 


况 ， 并 为 小 于 最 小 值 和 大 于 最 大 

























































































例会 出 现 一 些 错 误 。 其 中 一 个 错误 是 使 用 了 未 定义 的 异常 LogicError。 它 
































的 定义 是 Exception 的 一 个 子 类 ， 可 定义 了 这 个 异常 后 还 有 一 些 其 他 错误 ， 这 部 分 留 给 读者 进行 修正 。 











15.1.5 “为 测试 模仿 依赖 
为 了 对 Deck 进行 测试 ， 有 两 种 方式 来 解决 依赖 问题 。 
@ 模仿 : 可 以 为 card 类 创建 一 个 模仿 类 和 一 个 模仿 的 card() 工厂 函数 ， 用 于 创建 模仿 类 


的 对 象 。 使 用 模仿 对 象 的 优势 是 我 们 有 足够 的 信心 可 以 将 被 测试 单元 从 整个 解决 方案 : 

































































独立 出 来 ， 它 弥 




















补 了 其 他 类 产 





生 的 bug。 潜 在 的 缺陷 
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， 我 
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们 可 能 会 需要 对 一 个 行为 超 
































































































































































































































































































































































































































复杂 的 模仿 类 进行 调试 ， 来 确保 应 靖 元 符 代 了 了 实际 关 。 
@ 集成 : 如 果 我 们 非常 确定 Carq 类 层次 结构 和 carq () 工厂 函数 是 工作 的 ， 我 们 可 以 使 用 
它们 来 测试 Deck。 这 种 做 法 偏离 了 纯 单 元 测试 的 轨道 ， 单 元 测试 提倡 移 除 所 有 的 依赖 。 
在 实践 中 它 可 以 很 好 地 工作 ， 然 而， 对 于 一 个 可 以 通过 所 有 单元 测试 的 类 来 说 ， 它 与 模仿 
类 同样 是 可 以 信赖 的 。 对 于 在 非常 复杂 、 有 状态 的 API 的 环境 中 ， 应 用 类 可 能 比 模仿 类 更 
值得 信赖 。 这 种 做 法 的 缺陷 是 , 底层 的 一 个 类 一 旦 不 工作 ， 会 导致 所 有 依赖 它 的 测试 失败 。 
而 且 , 使 用 非 模仿 类 来 对 API 的 一 致 性 做 详细 测试 也 是 很 困难 的 。 模 仿 类 可 以 追踪 调用 记 
录 ， 可 以 统计 模仿 类 被 调用 的 次 数 以 及 参数 的 使 用 次 数 。 
可 以 使 用 unittest 包 中 的 unittest .mock 模块 来 对 已 有 类 打 补 丁 用 于 测试 ， 也 可 以 用 于 
定义 模仿 类 。 
在 设计 一 个 类 时 ， 必 须要 考虑 到 在 单元 测试 中 需要 被 模仿 的 依赖 部 分 。 对 于 Deck 例子 来 说 ， 有 
3 处 依赖 需要 模仿 。 
@ Card 类 : 这 个 类 很 简单 ， 只 需要 为 它 创 建 一 个 不 基于 任何 实现 的 模仿 类 。 由 于 Deck 类 
的 行为 并 不 依赖 card 中 的 任何 功能 ， 因 此 card 的 模仿 对 象 很 简单 。 
@ card() 工 厂 函 数 : 需要 使 用 一 个 模仿 函数 来 蔡 代 这 个 函数 ， 用 于 判断 Deck 对 这 个 函数 
的 调用 是 否 是 正确 的 。 
@ random.Random.shuffle() 方 法 : 为 了 判断 是 否 使 用 了 正确 的 参数 值 在 调用 这 个 方 
法 ， 可 以 使 用 一 个 模仿 类 来 追踪 它 的 使 用 而 不 再 包含 洗 牌 行为 。 











以 下 是 使 用 了 card() 工厂 函数 的 Deck 的 实现 。 


class Deck3 ( 


def 


def 


二 二 
二 这 和 


self, size= 


1, 


random=random.Random(), 


card factory=card ): 
super(). init () 


self.rng= random 


for d in range (size): 


SuUPer () .extend ( 


card factory (r,s) 


self.rng.shufflel 
deall( self ) : 


try 


return self.pop(0) 


except IndexError: 


以 上 定义 有 两 点 依赖 ， 通 过 参数 传 入 
和 一 个 纸牌 工厂 carq_factory， 


来 代替 默认 值 




















raise DeckEmpty () 

















对 象 。 


self ) 


工 页 宇 


for r in range(1,13) 


) 方法 中 。 它 需要 
在 测 











for s in Suits 


和 相 一 个 随机 数 生成 器 random 
试 时 ， 也 可 以 使 用 模仿 对 象 
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DeckEmpty 异常 。 
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引入 了 一 个 aeal () 方法， 打牌 的 行为 改变 了 了 对象。 如果 geck 是 空 的 ，deal () 方法 会 抛 出 




















在 以 下 这 个 测试 用 例 中 可 以 看 出 ，deck 被 正确 地 创建 了 。 


import unittest 











import unittest.mock 


class TestDeckBuid( unittest.TestCase ) : 
def setUp( self ): 
self.test card= unittest.mock.Mock( return value=unittest. 
mock.sentinel ) 
self.test rng= random.Random() 
self.test rng.shuffle= unittest.mock.Mock( return value=None ) 
def test deck 1 should build(selLf) : 
d= Deck3( size=1, random=self.test rng, card factory= self. 





test card ) 
self.assertEqual( 52*[unittest.mock.sentinel], 4d ) 
self.test rng.shuffle.assert called with( d ) 
self.assertEqual( 52, len(self.test card.call args list) ) 
expected = [ 
unittest.mock.call (r,s) 
for r in range(1,14) 

for s in ('%', 'S', 'v', '4') | 

self.assertEqual( expected, self.test card.call args list ) 


在 以 上 用 例 的 setUp () 方法 中 ,我们 创建 了 两 个 模仿 对 象 。 其 中 纸牌 工厂 函数 test_ card 是 



































一 个 模仿 函数 。 返 回 值 也 只 是 模拟 的 ,是 一 个 sentinel 对 象 ， 而 不 是 card 实例 。 由 于 sent inel 
是 唯一 的 对 象 ， 因 此 可 以 用 于 确定 所 创建 的 实例 数量 是 正确 的 。 它 和 所 有 其 他 的 Python 对 象 都 是 


不 同 的 ， 这 样 就 可 以 找 出 那些 没有 使 用 正确 返回 语句 而 返回 了 None 的 函数 。 


返回 





shuffle () 方 法 在 被 调用 时 是 否 使 用 了 正确 的 参数 。 


一 些 断 言 。 


































































































我 们 创建 了 一 个 random.Random() 生成 器 的 实例 ， 但 是 我 们 使 用 了 模仿 函数 ， 在 其 中 直接 
None 来 代替 shuffle () 方法 的 返回 值 。 这 样 ， 我 们 就 可 以 为 方法 返回 一 个 定 值 从 而 判断 出 





































































































在 我 们 的 测试 中 ， 使 用 两 个 模仿 对 象 创 建 了 一 个 Deck 类 ， 然 后 为 这 个 Deck 的 实例 a 做 了 

















@ 52 张 牌 都 被 创建 了 。 它 们 是 52 个 mock .sentinel 对 象 的 备份 ， 可 以 看 
数 参与 了 对 象 的 创建 。 

@ shuffle() 方 法 被 Deck 的 实例 所 调用 。 从 这 里 可 以 看 出 , 一 个 模仿 对 象 是 如 何 追 踊 调 用 
记录 的 ， 可 以 使 用 assert_called with () 来 确定 ,调用 snuffle() 的 时 候 ， 需 要 指定 
参数 值 。 

@ 工厂 函数 被 调用 了 52 次。 

@ 在 调用 工厂 函数 时 ， 使 用 了 所 期 望 的 牌 面值 和 花色 的 值 序列 作 为 参数 。 

在 Deck 类 定义 中 有 一 个 小 bug， 因 此 这 个 测试 没有 通过 。 这 个 bug 的 修复 作为 练习 留 给 读者 完成 。 





只 有 工厂 函 
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15.1.6 ”为 更 多 的 行为 使 用 更 多 的 模仿 对 象 


在 之 前 所 示 的 例子 中 ， 使 用 了 模仿 对 象 来 测试 Deck 类 的 创建 。 使 用 52 个 相同 的 模仿 对 象 导致 很 
难 确定 Deck 出 牌 行为 的 正确 性 ， 我 们 会 定义 一 个 不 同 的 模仿 对 象 来 测试 出 牌 功能 。 
这 里 是 第 2 个 测试 用 例 ， 用 来 确保 Deck 类 的 出 牌 行为 是 正确 的 。 


































































































class TestDeckDeal( unittest .TestCase ) : 
def setUP( self ) : 
self.test card= unittest .mock.Mock( side _ effect=range (52) ) 
self.test rng= zandom.Randqom () 
self.test rng.shuffle= unittest .mock.Mock ( return value=None ) 
def test deck 1 should deall(l self ) : 
d= Deck3( size=1, random=self.test rng, card factory= self. 





test card ) 


dealt = [] 
for c in range(52): 
c= d.deal () 


dealt .append (c) 





self.assertEqual( dealt, list (range (52)) ) 
def test empty deck should exception( self ) : 





d= Deck3( size=1l, random=self.test rng, card factory= self. 
test card ) 
for c in range (52): 
c= d.deal () 
self.assertRaises( DeckEmpty, d.deal ) 


纸牌 工厂 函数 的 模仿 对 象 使 用 了 siqe_effect 从 参数 来 调用 Mock () 。 当 传 入 一 个 可 迭代 对 
象 时 ， 会 返回 每 次 迭代 时 的 值 。 

我 们 对 shuffle () 方 法 进行 了 模仿 , 来 确定 纸牌 实际 上 没有 被 洗 。 希望 它们 保持 原来 的 顺序 ， 
这 样 测试 就 可 以 有 一 个 可 预测 的 期 望 值 。 
在 第 1 个 测试 (test deck 1 shoulg deal) 中 ,将 52 张 牌 的 结果 存 入 变量 dealt 中 。 然 
后 断言 在 这 个 变量 中 ， 包 含 的 52 个 牌 面值 与 模仿 纸牌 工厂 相 匹 配 。 
在 第 2 个 测试 (test_empty deck_shoulgd exception) 中 ， 打 出 Deck 实例 中 所 有 的 牌 
然而 ， 多 了 一 次 API 请 求 。 断 言 是 ， 在 打 完 所 有 的 牌 后 ，Deck .deal () 方法 会 抛 出 正确 的 异常 。 

由 于 Deck 类 相对 简单 ， 可 以 将 TestDeckBuild 和 TestDeckDeal 合并 为 一 个 类 ， 需 要 更 
复杂 的 模仿 对 象 。 而 在 这 个 例子 中 ,可 以 对 测试 用 例 进行 重 构 使 它们 变 得 简单 , 这 一 点 不 是 必需 的 。 
然而 ， 对 测试 过 度 的 简化 可 能 会 导致 一 些 API 功能 的 测试 遗漏 。 


15. 2 使 用 doctest 来 定义 测试 用 例 


相 比 unittest 模块 ，doctest 模块 为 我 们 提供 了 一 种 相对 简单 的 测试 方式 。 对 于 很 多 简单 
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交互 的 用 例 ， 可 以 在 docstring 中 表示 ， 并 使 用 daoctest 来 进行 自动 化 测试 。 它 会 将 文档 和 测 
试用 例 合并 为 一 个 包 。 

对 于 模块 、 类 、 方 法 或 函数 ，qoctest 的 用 例 被 写成 了 docstring。 在 一 个 doctest 用 例 中 ， 
向 我 们 展示 了 Python 中 交互 的 提示 >>>、 语 句 和 回复 。 在 doctest 模块 中 ， 包 含 了 一 个 在 
docstring 中 查找 这 些 示例 的 应 用 。 它 运行 指定 的 示例 ， 并 将 docstring 中 期 望 的 结果 与 实际 
结果 进行 对 比 。 
对 于 更 大 的 、 更 复杂 的 类 定义 而 言 ， 可 能 会 有 一 些 挑战 。 在 一 些 用 例 中 ， 可 以 看 到 这 样 的 做 法 
使 得 例子 中 打印 出 的 结果 很 难 被 使 用 ， 需 要 使 用 unittest 中 更 复杂 类 或 函数 来 进行 比较 。 
如 果 设 计 API 时 足够 谨慎 ， 就 可 以 创建 一 个 可 以 用 于 交互 的 类 。 如 果 它 可 被 用 于 交互 ， 然 后 就 
可 以 基于 交互 来 创建 一 个 doctest 的 例子 。 

事实 上 ， 在 一 个 设计 良好 的 类 中 有 两 个 属性 可 以 被 用 于 交互 ， 并 且 在 文档 字符 串 中 包括 了 
doctest 的 例子 。 许 多 内 置 的 模块 包含 了 在 API 中 doctest 的 例子 。 我 们 所 下 载 的 许多 其 他 包 中 
也 会 包含 goctest 的 例子 。 

对 于 简单 的 函数 ， 可 以 提供 如 下 所 示 的 文档 。 


def ackermann ( mr n ) : 
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"""Ackermann's Function 
ackermann( mr n ) -> 2+^{m-2} (n+3) —- 3 


See http://en.wikipedia.org/wiki/Ackermann function and 
http://en.wikipedia.org/wiki/Knuth%27s up-arrow notation. 


>>> from p3 cl1l5 import ackermann 
>>> ackermann (2, 4) 


1 

>>> ackermann (0, 4) 

5 

>>> ackermann (1,0) 

2 

>>> ackermann (1,1) 

3 

mm 

if m == 0: return n+l 

elif m > 0 and n == 0: return ackermann( m-1, 1 ) 


elif m > 0 and n > 0: return ackermann( m-l1l, ackermann( mr n-l1 ) ) 











我 们 定义 了 ackermann 函数 的 一 个 版 本 ， 包 括 了 一 些 docstring 注释 ， 其 中 有 与 Python 交互 的 




































































5 个 示例 回复 。 第 1 个 示例 回复 是 import 语句 ， 不 应 该 包含 输出 ， 在 其 余 4 个 示例 输出 中 展示 了 
函数 的 不 同 返回 值 。 
在 这 个 用 例 中 ， 结 果 都 是 正确 的 。 没 有 留 下 任何 隐藏 的 bug 给 读者 作为 测试 ， 我 们 可 以 使 




















用 goctest 模块 来 运行 这 些 测试 。 当 作为 程序 来 运行 时 ， 命 令 行 参数 就 是 需要 被 测试 的 文件 。 
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doctest 程序 对 所 有 的 docstring 进行 查找 ， 并 在 这 些 字 符 串 中 查找 要 进行 交互 的 Python 例 
子 。 在 doctest 文档 中 提供 了 用 于 字符 串 查 找 的 正则 表达 式 ， 这 一 点 很 重要 。 在 我 们 的 例子 中 ， 


为 了 辅助 doctest 解析 器 的 工作 ， 在 最 后 一 个 doctest 例子 后 面 添加 了 一 个 很 难 发 现 的 空白 行 。 



































































































































可 以 使 用 命令 行 来 运行 doctest。 
Python3.3 -~-m doctest p3 cl5.py 


如 果 一 切 正常 ， 不 会 有 任何 提示 。 可 以 通过 添加 -v 选项 来 查看 执行 的 详细 结果 。 






























































python3.3 -m doctest -~v p3 cl5.py 









































它 将 显示 出 每 个 docstring 以 及 每 个 从 docstring 中 所 返回 的 测试 用 例 的 详细 信息 。 














不 需要 任何 引用 任何 测试 以 及 包含 测试 的 组 件 ， 它 就 能 显示 出 不 同 的 类 、 函 数 以 及 方法 。 这 样 
就 可 以 确定 我 们 的 测试 在 docstring 中 被 正确 地 格式 化 了 。 
在 一 些 用 例 中 会 包含 一 些 输出 ， 在 使 用 Python 与 这 些 输出 交互 起 来 很 困难 。 在 这 些 用 例 中 ， 
需要 为 docstring 提供 一 些 注 释 ， 说 明 一 下 如 何 对 测试 用 例 以 及 所 期 望 的 执行 结果 进行 解析 。 
对 于 复杂 的 输出 ， 可 以 使 用 一 种 特殊 的 注释 字符 串 。 可 以 使 用 以 下 所 示 的 两 种 方式 中 的 任何 一 
种 来 启用 (或 禁用 ) 已 有 的 指令 ， 以 下 是 第 1 种 命令 。 



























































































































































# doctest: +DIRECTIVE 





以 下 是 第 2 种 命令 。 





# doctest: -DIRECTIVE 

在 期 望 结 果 的 处 理 上 ， 有 多 种 修改 方式 。 大 多 数 是 关于 空格 特殊 处 理 的 场景 ， 以 及 如 何 对 比 实 

际 结果 与 期 望 结果 。 
有 关 完 全 匹配 原则 ， 在 qoctest 文档 中 是 这 样 强调 的 。 
“doctest 是 重要 的 ， 需 要 与 期 望 结果 完全 匹配 ”。 































































































即使 是 一 个 字符 不 匹配 ， 测 试 也 会 失败 。 需 要 向 一 些 期 望 的 输出 
中 添加 一 些 灵活 性 。 如 果 发 现 添加 灵活 性 很 困难 ，unittest 是 
一 个 不 错 的 选择 。 


























以 下 是 一 些 特殊 情况 ， 期 望 结 果 与 实际 结果 匹配 起 来 不 是 很 容易 。 

@ Python 不 保证 字典 键 的 顺序 。 使 用 另 一 种 结构 来 代替 some qict ， 例 如 sorted 
(some _ qict.items () ) 。 

@ 方法 函数 id () 和 repzr () 涉及 物理 内 存 地 址 ， 如 果 使 用 #doctest : +ELLIPSIS 指令 来 显 
示 id() 和 repr () 并 在 示例 输出 中 使 用 ... 来 蔡 换 ID 和 地 址 ，Python 不 保证 它们 是 一 致 的 。 

@ 浮 点 数值 在 不 同 平台 可 能 是 不 同 的 。 总 是 使 用 格式 化 或 对 数位 进行 截取 的 方式 来 显示 浮 点 
数 是 有 意义 的 。 可 以 使 用 "{ : .4f}".format (value) 或 round (value, 4) 来 确保 非 符 



























































































































































































































































SoOrtedQq (Some set 














































































































般 通 过 模拟 的 time 或 者 datetim 
间 戳 ， 都 是 经 常 变 化 的 ， 不 应 该 使 有 用。 有时， 可 


决 


) 来 代 





























涉及 日 
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号 位 被 忽略 了 。 
在 Python 中 ,并 不 保证 集合 中 元 素 的 顺序 。 可 以 使 用 
不 应 当 使 用 当前 的 日 期 或 时 间 ， 因 为 它们 不 能 保证 一 致 性 。 
使 用 一 个 特殊 的 时 间或 日 期 ， 
@ ”操作 系统 中 的 参数 ， 例 如 文件 大 小 或 者 时 
在 doctest 脚本 中 包含 安装 和 纯 载 来 管理 OS 资源 。 在 
以 上 的 考虑 点 意味 着 ,我们 的 doctest 模块 中 可 能 会 包含 一 
可 能 使 用 过 类 似 以 下 这 样 的 代码 。 











>>> sum(values)/len 
3.142857142857143 











它 展 示 了 从 一 种 特殊 实现 中 返回 

















此 








(values) 








疆 














Se 
浮 点 数 





结果 可 能 会 不 同 。 需 要 做 


如 下 这 样 的 修改 。 





>>> round(sum(values)/len (values),4) 


3a1429 





这 个 值 被 四 








舍 五 入 了 ， 在 不 同 的 实现 ! 














15.2.1 将 doctest 与 unittest 相 结 合 


Tes 


组 件 。 如 果 没 有 指定 模块 , 将 使 





unittest TextTestR 


的 完整 输出 。 我 们 不 能 位 





是 不 会 变化 的 。 





地 将 它 复制 粘贴 到 aocstring 中 ， 


some set。 
其 或 时 间 的 测试 需要 
e 来 实现 。 


台 马 
能 会 


他 情况 下 , 推荐 对 os 模块 进行 模仿 。 
额外 的 处 理 ， 而 不 仅仅 是 APT， 


在 doctest 模块 中 有 一 个 钩子 ， 可 以 基于 docstring 的 注释 创建 一 个 适当 的 unittest . 











tSuite。 这 意味 着 ， 可 以 妊 


我 们 需要 创建 一 个 doctest 
















































































import doctest 


suite5= doctest.DocTestSuite() 


t= unittest.Text 


t.run( Suite5 ) 
我 们 基于 当前 模块 的 doct 




















来 创建 更 大 、 更 完整 的 组 件 。 


15.2.2 ”创建 一 个 更 完整 的 测试 包 


TestRunner (verbosity=2) 








est 

















对 于 大 型 应 用 来 说 , 每 一 个 





DS 
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全 

















地 使 





























目录 树 展示 了 这 些 模块 的 结构 。 


j 两 种 包 结构 : 在 应 ) 











应 用 模块 ， 
模块 中 使 用 


可 以 包含 















































字符 串 创建 了 一 个 组 件 ，suite5。 我 们 在 这 个 组 件 上 使 月 
unner。 男 一 种 方式 是 ,可 以 将 doctest 组 件 与 其 他 Testcases 相 结 合 




















储 








src 结构 ， 在 测试 模块 ! 

















使 用 












































test 结构 。 以 下 两 利 


E 大 应 用 中 同时 使 用 doctest 和 unittest。 
.DocTestSuite () 实例 。 它 会 从 一 个 模块 的 docstring 中 创建 一 个 
当前 运行 的 模块 创建 组 件 , 可 以 像 如 下 代码 这 样 来 使 用 一 个 模块 。 


有 了 


单独 的 模块 ,存放 模块 中 的 TestCases。 


D 
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src 
_init .py 
_main .py 
modulel.py 
module2.py 
setup.py 

test 
=n Tt .sD 
modulel.py 
module2.py 
all.py 


可 以 看 到 ， 两 种 结构 并 不 是 完全 并 行 的。 通常 不 会 为 setup .py 包含 一 个 自动 化 单元 测试 。 一 
个 良好 设计 的 _main _.py 可 能 不 需要 一 个 单独 的 单元 测试 ， 因 为 它 不 应 该 包含 太 多 代码 。 在 第 16 
蔓 “ 使 用 命令 行 ”中 ， 会 详细 介绍 几 种 设计 _main _.py 的 方式 。 

我 们 可 以 创建 一 个 最 上 层 的 test/al1.py 模块 ， 将 所 有 这 些 测试 放 进 一 个 组 件 




























































































































































































Import modulel 
Import module2 
import unittest 
import doctest 
all tests= unittest .TestSuite () 
for mod in modulel, module2: 
all tests.addTests( mod.suite() ) 
all tests.addTests( doctest.DocTestSuite (mod) ) 
t= unittest.TextTestRunner () 
t.run( all tests ) 


我 们 基于 其 他 测试 模块 中 的 组 件 创建 了 一 个 单独 的 组 件 al1_tests， 这 样 就 可 以 使 用 一 个 方便 
的 脚本 来 运行 有 效 的 测试 。 

还 有 几 种 可 以 使 用 unittest 模块 中 测试 查找 功能 的 方法 达到 同样 和 
来 执行 包 级 别 的 测试 ， 如 以 下 代码 所 示 。 

Python3.3 -m unittest test/*.py 

这 将 使 用 unittest 中 的 默认 测试 查找 功能 来 对 指定 文件 中 的 Testcases 进行 查找 。 这 样 做 
的 缺点 是 , 会 依赖 于 shel11 脚本 功能 , 而 非 纯 Python 功能 。 有 时 通配符 文件 规范 使 得 开发 更 复杂 ， 
因为 未 完成 的 模块 可 能 会 被 测试 。 


15.3 使 用 安装 和 钊 载 


在 unittest 模块 中 ， 存 在 3 个 级 别 的 安装 和 利 载 。 这 里 是 3 种 不 同 的 测试 范围 方法、 类 

和 模块 。 
@ ”在 测试 用 例 中 使 用 setUp () 和 tearDown() 方法 : 这 些 方法 可 以 确保 在 Testcase 类 中 ， 每 
个 单独 的 测试 方法 都 能 够 被 正确 地 安装 和 仓 载 。 我 们 通常 会 使 用 setUp () 方法 来 创建 单元 中 










































































人 个 


目的 。 我 们 将 从 命令 行 
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的 对 象 以 及 所 需要 的 模仿 对 象 。 通常 我 们 不 会 在 这 些 方法 中 做 代价 很 大 的 事情 (例如 ， 创 
建 整个 数据 库 )， 因 为 这 些 方法 会 在 每 个 测试 方法 的 执行 前 后 都 被 调用 。 

@ ”在 测试 用 例 中 使 用 setUpClass () 和 tearDownClass () 方法 : 在 同一 个 Testcase 类 中 , 这 
些 方法 只 会 执行 一 次 安装 和 伸 载 .这些 方 法 会 为 每 个 方法 创建 这 样 的 调用 顺序 : setUp ()、 
testMethod()、tearDown () 。 在 这 里 进行 数据 库 中 测试 数据 或 测试 模型 的 创建 和 销毁 
是 不 错 的 选择 。 

@ 在 模块 中 使 用 setUpModule () 和 tearDownModule() 函数 : 这 些 函 数 会 在 模块 内 所 有 
TestCase 类 创建 之 前 执行 一 次 性 的 安装 。 在 运行 TestCcase 类 之 前 ， 可 以 在 这 里 执行 
测试 数据 库 的 创建 和 销毁 。 

@ 很 少 情况 下 会 需要 定义 所 有 的 setUp () 和 teazDown () 方法 。 有 一 些 测试 场 景 将 会 成 为 
可 测试 性 设计 的 一 部 分 ， 这 些 场景 的 基本 区 别 是 集成 的 程度 。 如 之 前 所 提 到 的 ， 在 测试 层 
次 结构 中 会 包含 3 层 : 隔离 的 单元 测试 、 集 成 测试 和 系统 测试 。 有 以 下 几 种 方法 ， 包 含 了 
测试 工作 中 所 用 到 的 不 同 的 安装 和 仓 载 功能 。 

@ “没有 集成 一 一 没有 依赖 : 一 些 类 或 函数 没有 依赖 。 它 们 不 会 依赖 于 文件 、 设 备 、 其 他 进程 或 其 
他 主机 。 其 他 类 中 的 一 些 外 部 资源 可 以 被 模仿 。 当 Testcase .setUp () 方 法 的 开销 和 复杂 
度 很 小 时 ， 可 以 直接 创建 所 需要 的 对 象 。 如 果 要 模仿 的 对 象 非常 复杂 ， 可 以 使 用 类 级 别 的 
TestCase.SetUpClass () 来 降低 模拟 对 象 创建 的 开销 ， 它 将 用 在 被 测试 的 方法 中 。 

@ ”内 部 集成 一 一 有 部 分 依赖 : 在 类 或 模块 之 间 进 行 自动 化 集成 测试 通常 涉及 复杂 的 安装 情况 。 
我 们 可 能 会 有 一 个 复杂 的 、 类 级 别 的 setUpclass () 方法 或 模块 级 别 的 setUpModule () 来 
预备 集成 测试 的 环境 。 当 使 用 在 第 10 章 “ 用 Shelve 保存 和 获取 对 象 ” 以 及 第 11 章 “ 用 
SQLite 保存 和 获取 对 象 ”所 介绍 的 数据 访问 层 时 ， 就 可 以 进行 类 定义 和 访问 层 的 集成 测试 。 

其 中 包括 测试 数据 库 的 初始 化 或 shelf 所 需要 的 测试 数据 。 

@ 外 部 集成 : 可 以 使 用 系统 中 更 复杂 的 组 件 来 进行 自动 化 集成 测试 。 在 这 些 用 例 中 ， 可 能 会 
需要 依赖 外 部 进程 或 创建 数据 库 并 使 用 数据 来 初始 化 。 这 种 情况 下 ， 可 以 使 用 
setUpModule () 为 模块 中 所 有 的 Testcase 类 创建 空 数据 库 。 当 使 用 在 第 12 章 “ 传 输 
和 共享 对 象 ”中 所 介绍 的 RESTful Web 服务 或 对 第 17 章 “ 模 块 和 包 的 设计 ”中 介绍 的 宏 

观 编程 (Programming In The Large，PITL ) 进行 测试 时 ， 这 种 方式 会 很 有 用 。 

有 关 单 元 测试 的 概念 需要 注意 的 是 ， 被 测试 的 单元 并 没有 一 种 明确 的 定义 。 单 元 可 以 是 一 个 类 、 

一 个 模块 、 一 个 包 ， 甚 至 是 一 个 已 经 集成 的 软件 组 件 的 集合 ,仅仅 需要 从 环境 隔离 ， 成 为 测试 单元 。 
在 测试 集成 化 测试 时 ， 需 要 明确 知道 被 测试 的 组 件 ， 这 点 是 重要 的 。 我 们 不 需要 对 Python 的 

类 库 进行 测试 ， 它 们 有 自己 的 测试 。 同 样 地 ， 我 们 也 不 需要 对 OS 进行 测试 。 集 成 测试 一 定 要 重 

点 测试 我 们 所 写 的 代码 ， 而 不 是 我 们 下 载 安装 的 代码 。 


15.3.1 使 用 OS 资源 进行 安装 和 纯 载 


在 许多 情况 下 ， 测 试用 例会 需要 一 个 特殊 的 OS 环境 。 当 使 

































































































































































































































































































































































































































































































































































































































































外 部 资源 ， 例 如 文件 、 目 录 或 进 
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程 时 ， 可 能 会 需要 在 测试 之 前 对 它们 进行 初始 化 ， 可 能 也 需要 在 测试 前 将 这 些 资 源 移 除 ， 也 可 能 在 
测试 最 后 和 卸载 这 些 资源 。 

假如 有 一 个 函数 rounds_final () 用 于 对 指定 文件 进行 处 理 ， 需 要 测试 在 特殊 情况 下 这 个 
函数 的 行为 ， 例 如 文件 不 存在 ， 通 常会 看 到 以 下 结构 的 TestCases。 


import os 





















































class Test Missing( unittest .TestCase ) : 
def setUp( self ) : 

七 TY : 

os .remove ( "p3_c15_ sample.csv" ) 





except OSError as e: 
pass 
def test missingFile should returnDefault( self ): 
self.assertRaises( FileNotFoundError, rounds final, "p3 cl15 
sample.csv", ) 


我 们 需要 处 理 这 样 一 种 异常 ， 试 图 移 除 一 个 不 存在 的 文件 。 这 个 测试 用 例 中 的 setUp () 方法 可 以 确 
保 所 需 的 文件 不 存在 。 一 旦 setUp () 保证 文件 真 的 缺失 ， 可 以 使 用 缺失 的 文件 名 "p3_c15_sample.csv" 作 
为 参数 来 执行 rounds_final () 函数 。 我 们 期 望 它 会 扫 出 FiLeNotEounqError 错误 。 

注意 ，FileNotFoundError 是 Python 中 open () 方 法 的 默认 行为 。 它 根本 不 需要 测试 。 
这 样 就 有 一 个 重要 的 问题 : 为 什么 要 测试 一 个 内 置 的 功能 ? 如 果 我 们 进行 的 是 黑 盒 测试 ， 我 
们 需要 对 外 部 接口 的 所 有 功能 进行 测试 ， 包 括 所 期 望 的 默认 行为 。 如 果 进 行 的 是 白 盒 测试 ， 可 
能 希望 测试 异常 处 理 的 上 try: 语句 ， 它 在 rounds_final() 函数 内 部 。 

p3_c15_sample.csv 文 件 名 在 测试 中 被 重复 使 用 了 。 有 些 人 会 认为 即使 是 测试 代码 ,也 要 
应 用 DRY 原则 。 关 于 这 点 有 一 个 限制 ， 在 写 测试 时 ， 执 行 多 少 这 样 的 优化 是 有 价值 的 。 以 下 是 
建议 。 
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es 
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测试 代码 不 够 稳定 是 可 以 接受 的 。 对 应 用 作 的 很 小 的 改动 都 会 导 
致 测试 失败 ， 这 真 的 是 好 事情 。 测 试 只 需要 简单 清楚 ， 不 需要 稳 
定性 和 可 靠 性 。 


15.3.2 ”结合 数据 库 进 行 安 洋 和 凶 载 







































































当 使 用 数据 库 和 ORM 层 时 ， 会 经 常 需要 创建 测 斌 数据库、 文件 、 目 录 或 服务 器 进程 。 为 了 确 
保 其 他 测试 可 以 运行 ， 在 测试 通过 后 可 能 会 需要 凶 载 测试 数据 库 ， 而 在 测试 失败 后 可 能 不 会 想 要 凶 
载 数 据 库 。 不 对 数据 库 进行 任何 操作 ， 就 可 以 根据 执行 结果 对 失败 的 测试 进行 分 析 。 















































在 一 个 复杂 的 、 多 层 的 架构 中 ,管理 测试 范围 是 重要 的 。 回 顾 一 下 第 11 章 “ 用 SQLite 保存 和 获 
取 对 象 ” 中 ， 我 们 不 需要 对 SQLAlchemy 的 ORM 层 或 SQLite 数据 库 进 行 测试 。 在 应 用 测试 的 外 
部 ， 这 些 组 件 有 它们 自己 的 测试 过 程 。 然 而 ， 由 于 ORM 层 创建 了 数据 库 定 义 SQL 语句 ， 并 基于 
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代码 创建 Python 对 象 ， 因 而 不 能 够 轻易 对 SQLAlchemy 进行 模仿 并 希望 使 用 它 的 方式 是 正确 的 。 
我 们 需要 对 应 用 ORM 层 的 使 用 方式 进行 测试 ， 而 无 需 对 ORM 层 自 身 进行 测试 。 

在 测试 用 例 安 装 的 情况 中 ， 有 一 种 情况 很 复杂 ， 会 涉及 创建 数据 库 ， 并 基于 指定 测试 的 示例 数 
据 来 初始 化 数据 库 。 在 使 用 SQL 时 ， 会 运行 一 个 相当 复杂 的 SQL DDL 脚本 来 创建 需要 的 表 ， 然 后 
使 用 另 一 个 SQL DML 来 初始 化 这 些 表 。 至 于 印 载 ， 会 使 用 另外 一 个 复杂 的 SQL DDL 脚本 来 完成 。 

这 样 的 测试 用 例 将 会 很 元 长 ， 因 此 我 们 将 它 分 为 3 部 分 : 一 个 用 于 创建 数据 库 模型 的 函数 、 
setUpClass() 方 法 以 及 单元 测试 的 其 他 部 分 。 

以 下 是 创建 数据 库 的 函数 。 


from P2_c11 import Base, Blog, Post, Tag, assoc post 七 ad 
import datetime 























































































































































































































import sqlalchemy.exc 
from sqlalchemy import create engine 


def build test db( name='sqlite:///./p3 cl15 blog.db' ): 
engine = create engine (name, echo=True) 
Base.metadata.drop all (engine) 
Base.metadata.create all (engine) 
return engine 














以 上 代码 通过 移 除 与 ORM 类 相关 的 表 ， 并 重新 创建 新 表 来 刷新 数据 库 。 这 样 是 为 了 得 到 一 个 
刷新 的 数据 库 ， 并 且 直 到 最 后 一 次 运行 单元 测试 ， 这 个 数据 库 与 改变 后 的 设计 是 同步 的 。 

在 这 个 例子 中 ， 我 们 使 用 了 一 个 文件 来 创建 SQLite 数据 库 。 我 们 可 以 使 用 SQLite 数据 库 的 
in-memory 功能 来 使 得 测试 运行 得 更 快 。 使 用 内 存 数 据 库 的 缺点 是 ， 无 法 使 用 存储 的 数据 库 文件 
来 调试 失败 的 测试 。 

以 下 是 使 用 Testcase 子 类 的 例子 。 














































































































from sqlalchemy.orm import sessionmaker 
class Test Blog Queries( unittest.TestCase ) : 
Qstaticmethod 
def setUpClass () : 
engine= build test db() 
Test_ Blog Queries.Session = sessionmaker (bind=engine) 
session= Test Blog Queries.Session() 


tag rr= Tag( phrase="#RedRanger" 
session.add( tag rr ) 

tag w42= Tag( phrase="#Whitby42" 
session.add( tag w42 ) 

tag icw= Tag( phrase="#ICW" ) 
session.add( tag icw ) 

tag mis= Tag( phrase="#Mistakes" 
session.add( tag mis ) 


teh 





— 


blogl= Blog( title="Travel 2013" 


session.add( blogl ) 
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blpl= Post( date=datetime.datetime (2013,11,14,17,25), 


title="Hard Aground", 


rst text="""Some embarrassing revelation. 


Including ® and yb """, 
blog=blogl, 
tags= 
) 
session.add (blp1l) 


[tag rr, tag w42, tag icw]， 


blp2= Post( date=datetime.datetime (2013,11,18,15,30), 


title= 

rst text="""Some witty epigram. 

blog=blogl, 

tags= 

) 
session.add (blp2) 


"Anchor Follies", 


[tag_rr, tag w42, tag mis], 


blog2= Blog( title="Travel 2014" ) 
session.add( blog2 ) 
session.commit () 

















于 我 们 定义 了 setUpclass () ， 因 此 在 这 个 类 的 测试 运行 前 

义 很 多 测试 方法 ,它们 共享 一 个 公共 的 数据 库 配 置 。 

入 数据 。 
我 们 将 把 会 
























































话 生成 器 对 象 作为 类 级 别 的 属性 ，Test - 















































(bind=engine) 。 然 后 就 可 以 将 这 个 类 级 别 的 对 象 用 在 setUp () 
以 下 是 setUP () 和 两 个 单独 测试 方法 的 定义 。 
def setUp( self ) : 





self.session= Test Blog Queries.Session() 
def test query eqTitle should returnlBlog( self ) : 
results= self.session.query( Blog ) .filter!( 
Blog.title == "Travel 2013" ).all() 
1, len(results) ) 
2, len(results[0] .entries) ) 


self.assertEqual( 


self.assertEqual( 





def test query likeTitle s 





















































Including 四 and 沪 


I 将 会 


完成 了 数据 库 的 创建 ,就 可 以 创建 会 


hould return2Blog( self ) : 











LLL 
7 


创建 一 个 数据 库 。 我 们 可 以 定 
话 并 插 











Blog Queries.Session= sessionmaker 


以 及 每 个 测试 方法 中 。 












































results= self.session.gquery( Blog ) .filter!( 
Blog.title.like("Travel %$") ) .all() 
self.assertEqual( 2, lenl(results) ) 
setUp() 方法 创建 了 一 个 新 的 、 空 的 会 话 对 象 。 这 样 会 确保 每 次 查询 都 必须 生成 SQL 并 从 数 
据 库 获取 数据 。 
query eqTitle should return1Blog () 测试 会 查找 请 求 的 Blog 实例 , 并 通过 entries 
的 关系 导航 到 Post 实例 。 请 求 的 filter () 部 分 不 会 测试 应 用 的 定义 ， 它 会 调用 SQLAlchemy 和 

















SQLite。 最 后 断言 中 的 results[0] .entries 会 对 类 定义 进行 测试 。 
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查 





Set (七 .P 





找 所 有 文章 。 





我 人 


] 必 须 使 用 一 

TestCase 子 类 
个 数据 库 模 型 和 
会 非常 复杂 ， 通 常 从 文 伯 


query likeTitle should return2 
试 。 它 并 没有 对 我 们 的 应 用 作 任 1 
放 在 初始 化 时 期 完成 ， 














以 下 是 为 外 两 


def test query eqW42 tag should return2Post( 


可 测试 性 的 设计 


Blog() 
可 有 意义 的 测试 ， 


















































这 使 得 应 用 的 API 显得 更 明 而 

















个 测试 方法 。 





results= self.session.gquery (Post)\ 


.join(assoc post tag) 


self.assertEqual( 
def test query eqICW tag should returnlPost!( 


.join (Tag) 
Tag.phrase == "#WwWhitby42" ) 
2, 





len(results) ) 





results= self.session.gquery (Post)\ 


.join(assoc post tag) 
Tag. 
self.assertEqual 
self.assertEqual 
self.assertEqual 
self.assertEqual 
set(t.phrase for 七 in 


.join (Tag) 
phrase == "#ICW" ) .all() 
1, len(results) ) 





( 
( 
( 
( set (["#RedRanger", 
results[0] .tags)) 


query eqW42 tag should return2Post() 


类 似 地 , 对 于 




















它 测试 到 了 很 多 类 定义 











的 关系 。 








query eqICW tag should return1lPost ( 





， 因 为 SQL 不 保证 结 





Test 





"Hard Aground", results[0] 
"Travel 2013", results[0] .blog.title) 


_Blog_Queries 的 重要 之 处 在 于 它 通 


self ): 


.filterl( 
.all() 


self ): 


.filterl( 


.titl 


"#Whitby42", 




















es) 


mW#ICW"] ) ， 


Blog 属性 。 














平 完全 是 在 对 SQLAlchemy 和 SQLite 进行 测 
b 现 了 title 和 
， 尽 管 它们 没有 提供 像 测试 用 例 那样 的 人 


这 种 测试 主要 
介 值 。 








测试 执行 了 一 个 复杂 的 查询 ， 根 据 指定 标签 








果 的 顺序 。 





























个 特殊 定义 的 行 集合 。 对 于 数据 库 应 ) 























15.4 TestCase 的 类 层次 结构 


继承 在 Testcase 类 中 是 有 效 的 。 



































































































































或 JSON 文档 中 完成 示例 行 的 加 载 ， 前 ) 

















里 想 情 况 下 ， 每 个 Testcase 是 
































) 测试 也 使 
它 测试 了 通过 results[0] .blog.title 来 完成 从 Post 到 所 属 
hrase for tt in results[0] .tags) 来 完成 从 Post 到 相关 的 Tags 
个 显示 的 set () 


























Blog 的 过 得 











通过 setUpClass( 






































唯一 的 。 实 际 上 ， 


了 一 个 复杂 的 查询 。 
呈 ， 也 测试 到 了 通过 











集合 的 导航 。 








() 方法 创建 了 一 


这 种 安装 测试 是 有 帮助 的 。 它 可 能 
不 是 直接 编码 在 Python ' 
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之 间 会 有 公共 的 功能 ， 可 使 用 以 下 3 种 方式 来 共享 Testcase 类 之 间 的 共同 点 。 
@ 通用 的 setUp() : 可 能 会 有 一 些 在 多 个 Testcase 中 使 用 的 数据 ， 没 有 必要 重复 这 些 数 
据 。 如 果 一 个 Testcase 类 中 只 包含 setUp () 或 tearDown () 的 定义 而 没有 任何 测试 方 
法 ， 这 样 是 合法 的 ， 但 是 它 会 导致 很 困惑 的 日 志 ， 因 为 它 没有 包含 测试 。 
@ 通用 的 tearDown() : 为 包含 了 OS 资源 的 测试 创建 一 个 公共 的 清理 函数 是 常见 的 。 我 们 
可 能 会 希望 移 除 文件 和 目录 或 终止 子 进程 。 
@ 公共 的 结果 检查 函数 : 对 于 逻辑 复杂 的 测试 ， 可 以 使 用 公共 的 结果 检查 方法 来 对 结果 中 的 
一 些 特性 进行 验证 。 








两 个 其 他 值 为 一 个 字典 中 缺失 的 值 进行 了 赋值 。 


回顾 一 下 第 3 章 “ 属 性 访 












































class RateTimeDistance 


def 


def 


def 


def 


ts ho Wh eo Wh 








问 、 特 性 和 修饰 符 ” 例如 ， 























( dict. )s 
*args, **kw ) : 


super(). init ( *args, **kw ) 


self. solve() 
“getattri 2 Se 
return self.ge 
__setattr ( se 
self[name]= va 
self. solve() 


_dir ( self ): 


return listl(se 


lf, name ): 

t (name, None) 

lf, name, Value ): 
lue 





lf.keys()) 


def solve (self): 
if self.rate is not None and self.time is not None: 

self['distance'] = self.rate*self.time 

elif self.rate is not None and self.distance is not None: 

self['time'] = self.distance / self.rate 

elif self.time is not None and self.distance is not None: 

selfl[l'rate'] = self.distance / self.time 


它 的 每 个 单元 测试 方法 会 包含 以 下 代码 : 





self.assertAlmost 

















如 果 我 们 使 用 
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RateTimeDistance 类 。 这 个 类 基于 





Equal ( object.distance, object.rate * object.time ) 














TestCase 的 很 多 子 类 ， 可 以 继承 并 使 ) 











def validate( self, object ) : 





以 下 这 个 方法 来 完成 验证 : 


self.assertAlmostEqual( object.distance, object.rate * object .time 
































需 在 每 个 









































过 


























I 试 中 包含 self.valiqate (object) 来 确认 所 有 的 测试 都 提供 了 正 























单元 测试 模块 中 的 一 个 重要 定义 是 测试 用 例 使 用 了 正确 的 类 并 且 正 确 地 使 用 了 继承 。 我 们 可 以 











像 定 义 应 用 中 类 那样 ， 谨 慎 地 对 Testcase 类 层次 结构 的 细节 进行 定义 。 
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上 而 言 ， 用 户 可 人 
8 转换 为 软 
































个 行 为 的 描述 。 















































Ce 达 出 描述 软件 行为 的 处 理 规则 。 在 其 他 情况 下 ,分 析 师 或 设计 











在 许多 情况 下 , 用 户 如 果 能 够 提供 具体 期 望 结果 的 示例 会 带 来 很 多 好 处 。 对 于 一 些 面向 商务 的 



































应 用 来 说 ， 用 户 可 能 更 倾向 了 


























据 ， 可 以 简化 软件 的 开发 。 
任何 时 候 ， 如 果 可 能 的 

















使 用 Excel 表格 来 展示 输入 和 期 

















望 输出 的 示例 数据 。 有 了 用 户 提供 的 数 

























































































话 ， 应 当 由 真实 用 户 提供 正确 结果 的 示例 数据 。 创 建 过 程 描述 或 软件 规 



































格 说 明 是 非常 难 的 。 创 建 具 体 示 例 并 基于 它们 来 生成 软件 规格 说 明 会 降低 复杂 度 并 减少 一 些 困 惑 。 
进一步 说 ， 它 进入 了 测试 用 例 驱动 开发 的 研发 模式 。 给 定 了 一 套 测 试用 例 ， 我 们 就 有 了 关于 完成 的 
体 定义 。 对 软件 项 目 状态 的 追踪 相当 于 是 在 问 ， 今 天 我 们 有 多 少 个 测试 用 例 ， 它 们 通过 了 多 少 。 
且 给 定 一 个 具体 示例 的 电子 表格 ， 就 需要 把 每 一 行 转换 为 一 个 TestCase 实例 ， 然 后 可 以 
基于 这 些 对 象 创建 一 个 套件 。 

对 于 本 章 中 的 例子 ， 我 们 从 一 个 Testcase 子 类 中 加 载 了 测试 用 例 ， 使 用 了 unittest . 
defaultTestLoader.loadTestsFromTestCase 来 查找 所 有 名 称 以 test 为 起 始 的 所 有 方法 。 加 
载 器 从 每 个 方法 中 创建 了 一 个 测试 对 象 并 将 它们 合并 到 一 个 测试 套件 中 。 实 际 上 ， 由 加 载 器 创建 的 每 个 
对 象 都 是 不 连续 的 ， 通 过 在 类 构造 函数 中 使 用 测试 用 例 名 SomeTestCase ("test method name") 
来 完成 。 传 入 SomeTestcase init _() 函数 的 参数 将 作为 类 定义 中 的 方法 名 。 每 一 个 方法 都 被 
单独 阐述 为 一 个 测试 用 例 。 

对 这 个 例子 来 说 ， 我 们 将 使 用 其 他 方式 来 创建 测试 用 例 的 实例 。 定 义 一 个 包含 一 个 测试 的 类 ， 
然后 将 这 个 Testcase 类 的 多 个 实例 加 载 到 套件 中 。 这 时 ，Testcase 类 只 能 被 定义 一 次 ， 而 且 
默认 情况 下 ， 方 法 名 应 该 为 runTest () 。 我 们 不 会 使 用 加 载 器 来 创建 测试 对 象 ， 将 直接 基于 外 部 
提供 的 数据 来 创建 它们 。 
这 里 看 一 个 需要 测试 的 具体 函数 。 它 在 第 3 章 “ 属 性 访问 、 特 性 和 修饰 符 ” 中 介绍 过 了 。 























































































































































































































































































































































































































from pl c03 import RateTimeDistance 

这 个 类 在 初始 化 时 提前 计算 了 很 多 属性 。 这 个 简单 函数 的 用 户 以 电子 表格 的 形式 给 我 们 提供 了 
一 些 测试 用 例 ， 它 来 自我 们 所 提取 的 CSV 文件 。 有 关 更 多 CSV 文件 的 信息 ， 可 以 参见 第 9 章 “ 序 
列 化 和 保存 一 一 JSON、YAML、Pickle、CSV 和 XML”。 我 们 需要 将 每 一 行 转换 为 TestCcase。 










































































rate in,time in,distance in,rate out,time out,distance out 
Pc ee) 

Dy Sladyl 

Pg a Ne a NR 2 ts Wi Ne De: 


可 以 使 用 以 下 这 个 测试 用 例 来 基于 CSYV 文件 中 的 每 行 数据 创建 测试 实例 : 


def float or none( text ): 








if lenl(text) == 0: return None 





return float (text) 


Class Test RID( unittest.TestCase ): 
def init ( self, rate in,time in,distance in, 

rate out,time out,distance out ) : 

super(). init () 

self.args = dict( rate=float or none(rate in), 
time=float or none (time in), 
distance=float or none (distance in) ) 

self.result= dict( rate=float or none (rate out), 
time=float or none (time out), 
distance=float or none (distance out) ) 
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def shortDescription( self ): 
return "“{0} -> {1}".format (self.args, self.result) 
def setUp( self ): 
self.rtd= RateTimeDistance( **self.args ) 
def runTest( self ) : 














self.assertAlmostEqual( self.rtd.distance, self.rtd.rate*self. 
rtd.time ) 

self.assertAlmostEqual( self.rtd.rate, self.result['rate'] ) 

self.assertAlmostEqual( self.rtd.time, self.result['time'] ) 

self.assertAlmostEqual( self.rtd.distance, self. 


result['distance'] ) 






































float_or_none () 函数 是 用 于 处 理 CSV 源 数 据 常 见 的 方式 。 它 将 每 个 单元 格 的 文本 转换 为 
float 数值 或 None。 


Test_RTD 类 做 3 件 
@ _init () 方 法 将 一 行 电子 表格 的 数据 转换 为 两 个 字典 的 值 : 输入 值 self .args 和 期 望 的 
输出 值 self.result。 
@ setUp () 方 法 用 于 创建 RateTimeDistance 对 象 并 提供 输入 参数 值 。 
@ runTest () 方法 会 基于 用 户 提供 的 数据 来 对 结果 进行 检查 进而 简化 输出 的 验证 过 程 。 
还 提供 了 一 个 shortDescription() 方 法 , 返回 了 对 测试 的 简单 总 结 , 这 对 于 调试 是 有 帮助 
的 。 可 以 使 用 如 下 代码 创建 一 个 套件 : 


import csv 
def suite9(): 


suite= unittest .TestSuite () 


























| 中 


季 。 
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with open("p3 cl15 data.csv","r",newline="") as Source : 
rdr= csv.DictReader( source ) 
for roOW- Tn Tdrs 
suite.addTest( Test RID(**row) ) 
return suite 























我 们 打开 了 CSYV 文件 , 然后 对 每 行 测试 用 例 进行 读 取 并 转换 为 dqict 对 象 。 如 果 CSYV 列 标题 与 
Test_RTD. init _ () 方 法 的 期 望 值 相 匹 配 ， 那 么 每 行 会 成 为 一 个 测试 用 例 对 象 并 会 被 加 载 进入 
套件 中 。 如 果 列 标题 不 匹配 , 会 得 到 一 个 KeyError 异常 , 需要 对 电子 表格 进行 修改 , 与 Test_RTD 
类 匹配 。 可 以 使 用 如 下 方式 来 运行 测试 。 


































































































t= unittest.TextTestRunner () 
t.run( suite9() ) 











2 

输出 如 下 : 

本 全 用 

FAIL: runTest ( main .Test RTD) 


{'rate': None, 'distance': 13.0, 'time': 11.0} -> {'rate': 1.18, 
'distance': 13.0, 'time': 11.0} 


被 修改 为 更 多 位 数 ， 要 么 在 测试 ! 





Traceback (most recent call last): 


File "p3 cl5.py", line 504, in runTest 
self.assertAlmostEqual( self.rtd.rate, self.result['rate'] ) 


AssertionError: 1.1818181818181819 != 1.18 within 7 places 





Ran 3 tests in 0.000s 


FAILED 





(failures=1 


j 户 提供 的 数据 有 






































个 小 问题 , 提供 的 是 一 个 只 被 四 舍 五 入 到 两 位 的 值 。 要 
需要 文 持 两 位 数 。 


] 户 提供 精确 的 示例 数据 ， 可 能 不 太 实际 。 如 果 





None 













































































依赖 / 
































的 测试 就 需要 根据 用 户 的 输入 包含 更 多 的 四 舍 五 入 。 电 子 表格 显示 的 数据 看 上 















































么 提供 的 数据 需要 





j 户 提供 的 数据 无 法 足够 精确 ， 那 么 我 们 











去 都 已 经 是 精确 的 
浮 点 数 ， 因 此 这 项 



































decimal 类 型 了 ， 它 们 可 能 已 经 被 四 舍 五 入 或 者 被 转换 为 了 只 是 一 个 近似 值 的 
工作 是 有 挑战 的 。 在 多 数 情 况 下 ， 可 以 假设 数据 全 部 已 经 被 四 舍 五 入 了 ， 而 不 必 
的 逆向 工程 来 试图 解析 用 户 的 意图 。 
































15.6 自动 化 集成 和 性 能 测试 


unittest 来 对 一 个 由 多 个 集成 的 组 件 组 成 的 单元 进行 自动 化 测试 , 仅 当 软件 


























我 们 可 以 使 用 unittest 包 对 那些 不 是 单独 的 类 定义 进行 测试 。 如 之 前 所 

















































































































通过 对 电子 表格 做 























介绍 的 ， 可 以 使 用 
每 个 隔离 的 组 件 都 











已 经 通过 了 单元 测试 时 ， 才 进行 这 样 的 集成 测试 。 当 一 个 组 件 没 有 通过 单元 测试 时 ， 去 调试 一 个 失 
败 的 集成 测试 是 没有 意义 的 。 


























性 能 测试 可 以 在 多 个 集成 的 层面 上 被 完成 。 对 于 大 应 ) 





j 来 说 ， 对 整个 系统 进行 性 能 测试 不 会 带 




















来 太 多 好 处 。 有 一 种 传统 的 观点 是 ， 一 个 程序 中 10% 的 代码 占 了 整个 执行 时 间 的 90%。 
























































因此 ， 我 们 不 必要 







































































对 整个 系统 进行 优化 ， 我 们 只 需要 对 造成 性 能 瓶颈 的 部 分 进行 评测 。 

在 一 些 情 况 下 ， 我 们 有 一 个 用 于 搜索 的 数据 结构 。 移 除 这 个 搜索 会 带 来 显著 的 性 能 提升 。 正 如 
我 们 在 第 5 章 “ 可 调用 对 象 和 上 下 文 的 使 用 ”中 实现 记忆 化 可 以 带 来 显著 的 性 能 提升 ， 因 为 避免 了 
重复 计算 。 

为 了 执行 正确 的 性 能 测试 ， 需 要 遵照 以 下 3 个 步骤 。 


























@ ”通过 结合 使 用 设计 审查 与 代码 分 析 来 找 出 可 能 对 应 用 造成 性 能 问题 的 部 分 
有 两 个 分 析 模 块 。 











。Python 标准 库 中 






























































@ 使 用 unittest 创建 一 个 自动 化 测试 场景 来 展示 任何 实际 ! 
或 time .perf_counter () 来 收集 性 能 数据 。 

@ ”对 选择 的 测试 用 例 代码 进行 优化 ， 直 到 性 能 满意 为 止 。 

目的 是 为 了 尽 可 能 多 的 自动 化 ， 





的 性 




































































数 情况 下 ， 对 核心 数据 结构 或 算法 (或 两 者 ) 进行 修改 会 导致 大 规模 的 重 构 。 自 























除非 有 复杂 的 需求 ，cProfile 才 会 对 应 用 需要 关注 的 部 分 进行 查找 。 





能 问题 。 使 用 timeit 


并 避免 为 了 带 来 性 能 的 提升 对 代码 进行 模糊 意义 的 修改 。 大 多 


动 化 测试 会 使 得 大 





-HH 


规模 重 构 更 实际 。 
一 个 尴 粹 的 情 
























































让 程序 更 快 些 可 能 是 必要 的 。 当 有 评测 性 能 的 标准 时 ， 





















































结果 是 否 正确 的 同时 运行 时 间 能 否 接 受 。 
可 以 使 用 以 下 代码 进行 性 能 测试 。 


import unittest 











import timeit 
class Test Performance( unittest.TestCase ): 


def test simpleCalc shouldbe fastEnough ( 





t= timeit.timeitl( 


stmt="""RateTimeDistancel( 


rate=1, time= 


self ) : 


2 


ya 





setup="""from pl c03 import RateTimeDistance"™"" 


) 
print( "Run time", 七 ) 


self.assertLess( t, 10, 


以 上 代码 使 用 了 unittest 来 完成 自动 化 性 能 测试 。 
1000000 次 ， 这 样 可 以 使 得 测试 结果 更 准确 。 





























大 








"run time {0} >= 10" .format (七 ) ) 


为 timeit 模块 对 指定 语句 执行 了 
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区 是 性 能 测试 中 缺少 一 个 具体 的 合格 与 否 的 标准 。 在 没有 对 “足够 快 ” 下 定义 时 ， 
事情 总 会 容易 一 些 ， 性 能 测试 可 以 ) 








[a 
9 

















| 来 衡 





在 之 前 的 例子 中 , 每 个 RTD 结构 的 执行 时 间 需 要 小 于 1/100000 秒 , 执行 1000000 次 应 该 小 于 


10 秒 。 
士 
15. 7 ” 总结 








我 们 介绍 了 使 / 























] unittest 和 doctest 来 创建 自动 化 单元 测 














测试 的 集合 可 以 被 打包 起 来 重 ) 











j， 被 放 入 套件 中 获得 





更 大 




















我 们 还 介绍 了 如 何 创建 模 








仿 对 象 ， 这 样 可 以 隔离 软件 











元 对 
































扼 载 的 方式 。 这 样 就 可 以 应 对 包含 了 复杂 的 初始 化 状态 或 存储 结果 的 测试 。 
doctest 和 unittest 都 很 好 地 符合 了 单元 测试 的 FIRST (Fast Isolated Repeatable Self-Validating 





7 





Timely) 特性 。FIRST 特性 如 下 
速度 快 : 

















































































































保 可 重复 性 。 





























们 可 以 使 用 这 一 点 对 设计 进行 评估 来 确 

可 重复 性 : 使 用 qoctest 和 unittest 做 自动 化 讽 
自我 检验 : 基于 测试 用 例 条 件 来 创建 测试 结果 ， 确 
及 时 性 : 一 旦 完成 了 类 、 函 数 或 模块 

测试 中 只 
























































] 例 。 


试 ， 也 介绍 了 可 以 创建 测试 套件 ， 
而 无 需 依赖 自动 化 测试 查找 进程 。 
进行 测试 ， 也 介绍 了 几 种 安装 和 





只 要 不 是 写 得 很 糟糕 的 测试 ，doctest 和 unittest 的 性 能 都 会 很 好 。 
隔离 : 在 unittest 的 包 中 提供 了 一 个 模仿 模块 ， 可 以 用 于 隔离 类 定义 。 
保 组 件 之 间 是 彼此 隔离 的 。 

1 试 来 确 
上 保 在 测试 
的 骨架 ， 就 可 以 编写 和 运行 测试 | 
包括 返回 pass 的 逻辑 ， 也 可 以 作为 一 个 测试 脚本 来 运行 。 
在 软件 管理 方面 ， 测 试 总 数 和 通过 的 测试 总 数 在 软件 状态 报告 中 有 时 是 非常 有 用 的 。 


进一步 说 ， 我 


没有 包含 主观 的 判断 。 





即使 一 个 类 的 
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15.7.1 设计 要 素 和 折 中 方案 


创建 软件 时 ,测试 用 例 也 是 需要 交付 的 。 任 何 没 有 自动 化 测试 的 功能 也 是 不 应 该 存在 的 ， 没有 
测试 的 功能 是 不 能 被 相信 的 。 如 果 不 能 被 相信 ， 就 不 应 该 被 使 用 。 
唯一 的 权衡 点 是 ， 使 用 aocttest 还 是 unittest， 或 两 者 一 起 使 用 。 对 于 简单 的 程序 ， 
doctest 是 不 错 的 选择 。 对 于 复杂 一 些 的 场景 ， 就 有 必要 使 用 unittest。 对 于 一 些 框架 ，API 
文档 需要 包括 一 些 示 例 ， 那 么 两 者 一 起 使 用 就 比较 好 。 

在 一 些 情况 下 ， 创 建 完 整 的 Testcase 类 定义 的 模块 就 足够 了 。 可 使 用 TestLoader 类 和 测 
试 查找 功能 来 实现 测试 查找 。 
在 普遍 情况 下 ,unittest 包含 了 使 用 TestLoader 从 每 个 Testcase 子 类 中 提取 测试 方法 。 
将 这 些 测试 方法 打包 到 一 个 类 中 , 它们 将 共享 类 级 别 的 setUp () ,有 可 能 也 会 共享 setUpClass () 
方法 。 
也 可 以 不 必 使 用 TestLoader 来 创建 Testcase 实例 。 这 样 的 话 ，runTest () 的 默认 方法 
就 被 定义 来 包含 测试 用 例 的 断言 ， 可 以 基于 这 种 类 的 实例 创建 一 个 套件 。 

最 难 的 部 分 是 可 测试 性 的 设计 。 为 了 确保 单元 可 以 被 独立 地 测试 ， 需要 移 除 依赖 ， 有 时 会 认为 
这 样 做 增加 了 软件 设计 的 复杂 度 。 对 于 大 部 分 情况 ， 发 现 并 移 除 依赖 是 一 种 时 间 上 的 投资 ， 为 的 是 
创建 可 维护 性 更 强 和 更 灵活 的 软件 。 

一 般 的 规则 是 : 类 之 间 包 含 隐 式 依赖 是 糟糕 的 设计 。 

可 测试 的 设计 中 会 包含 显 式 的 依赖 ， 它 们 可 以 被 使 用 模仿 对 象 轻易 地 替代 。 


15.7.2 展望 
在 下 一 章 中 ， 我 们 会 介绍 如 何以 命令 行 作为 起 始 来 编写 完整 的 应 用 ， 还 会 介绍 几 种 在 Python 
j 中 处 理 启 动 选 项 、 环 境 变量 和 配置 文件 的 方法 。 
在 第 17 章 “ 模 块 和 包 的 设计 ”中 ， 会 对 应 用 设计 的 扩展 方面 进行 介绍 。 如 何 将 应 用 组 合 到 大 
的 应 用 中 以 及 如 何 将 大 的 应 用 分 解 为 小 的 部 分 。 




































































































































































































































































































































































































































































服务 器 的 实现 。 有 
参数 解析 和 应 用 程 























命令 行 启动 选项 、 环 境 变 量 和 配置 文件 对 许多 应 用 程序 都 非常 重要 ， 特 别 是 
许多 方法 可 以 处 理 程 序 启动 和 创建 对 象 的 过 程 。 我 们 会 在 本 章 中 探讨 两 个 问题 : 
序 的 总 体 架 构 。 

本 章 中 会 扩展 第 13 章 “ 配 置 文件 和 持久 化 ”中 介绍 的 配置 文件 处 理 ， 我 们 会 使 用 更 多 为 命令 
行程 序 和 顶层 服务 器 提供 的 技术 。 我 们 还 会 扩展 第 14 章 “Logging 和 Warning 模块 ”中 介绍 的 一 些 
日 志 记 录 的 设计 方法 。 

在 下 一 章 中 ， 我 们 会 扩展 这 些 原则 来 继续 介绍 一 种 被 称 为 宏观 编程 的 架构 设计 方法 。 我 们 会 用 
命令 模式 定义 不 用 借助 shell 脚本 就 可 以 定义 可 聚合 的 软件 组 件 。 当 编写 在 应 用 程序 服务 器 上 使 用 的 
后 台 处 理 组 件 时 ， 这 种 方法 非常 有 用 。 





























































































































































































































16.1 操作 系统 接口 和 命令 行 


通常 ，shell 会 用 一 些 构成 OS API 的 信息 来 启动 应 用 程序 。 
@ shell 会 为 每 个 应 用 程序 提供 环境 变量 的 集合 。 在 Python 中 ， 这 些 集合 可 以 通过 
os .environ 访问 。 
shell 会 准备 3 种 标准 文件 。 在 Python 中 ， 这 3 种 文件 对 应 的 是 sys . stdqin、sys .stdout 
和 sys.stderr。 还 有 一 些 其 他 的 模块 ， 例 如 fileinput 可 以 访问 sys .stqdin。 
@ shell 会 将 命令 行 解析 为 一 些 单词 ， 命 令 行 的 一 部 分 可 以 通过 sys .argv 来 访问 。Python 
会 提供 原始 命令 行 中 的 一 些 信息 ， 我 们 会 在 下 面 的 部 分 中 详细 介绍 这 点 。 对 于 POSIX 操 
作 系统 ，shell 可 能 会 蔡 换 shell 的 环境 变量 并 展开 通配符 文件 名 。 在 Windows 中 ， 简 单 的 
cmd .exe shell 不 会 为 我 们 展开 文件 名 。 
@ 操作 系统 也 维护 了 一 些 上 下 文 设 置 ， 例 如 当前 工作 目录 、 
过 os 模块 访问 。 它 们 没有 作为 参数 在 命令 行 中 提供 。 
OS 希望 应 用 程序 结束 时 能 够 提供 一 个 数字 状态 码 。 如 果 我 们 想 访 问 一 个 特定 的 数字 状态 码 ， 
可 以 在 应 用 程序 中 使 用 sys .exit () 。 如 果 我 们 的 程序 正常 结束 ，Python 会 返回 0。 












































































































































































































































户 ID 和 用 户 组 。 这 些 可 以 通 
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和 


词 。 

















第 1 个 和 


shell 的 操作 是 操作 系统 API 的 重要 部 分 。 对 于 一 行 给 定 的 输入 ， 基 于 《更 复杂 的 ) 引用 规 由 
换 操作 。 然 后 ， 它 会 将 生成 的 结果 转换 为 用 空格 分 隔 的 一 行 和 


词 一 定 是 内 置 的 shell 命令 (例如 ca 或 者 set ) 或 者 某 个 文件 的 名 称 。shell 会 在 它 


换 选 项 ，shell 会 执行 一 系列 的 











义 的 PATH 中 搜索 这 个 文件 。 


证 一 个 文件 成 为 可 执行 文件 。 如 果 文 件 名 匹配 但 是 该 文件 不 是 可 执行 的 ， 就 会 得 到 




















命令 中 的 第 1 个 单词 指定 的 文人 


























Denied 错误 。 
一 个 可 执行 文件 开头 的 一 些 字 节 包含 一 个 约 数 ,shell 会 基于 这 个 数字 来 决定 执行 这 个 文件 的 方式 。 


一 些 幻 数 指 昌 
b '#! 7 ， 指 出 该 文件 是 脚本 ， 需 要 


参数 (python 3.3) 会 初始 化 配置 环境 3} 
事实 上 ， 通 过 可 执行 脚本 从 操作 系统 shell 到 Python 的 步骤 类 似 下 面 这 样 。 
1. shell 解析 ourapp.py -s someinput .csv。 第 1 个 单词 是 ourapp.py。 这 个 文件 在 


4. ”Python 基于 找到 的 选项 执 
会 使 用 site 模块 设置 查找 路 

















我 们 经 常用 下 面 这 行 指令 。 


#!/usr/bin/env python3.3 








374 第 16 章 使 用 命令 行 
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必须 拥有 execute (x) 权限 。shell 命令 chmod +x somefile.py 


该 文件 是 可 执行 二 进 制 文件 ，shell 可 以 启动 
使 用 解释 器 来 执行 。 这 种 文件 第 





一 个 OS Permission 



































个 子 shell 来 执行 它 。 其 他 的 幻 数 ， 尤 其 是 












































如 果 一 个 Python 文件 拥有 执行 权限 3 
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1 行 的 其 他 部 分 是 解释 器 的 名 称 。 


以 这 行 作为 首 行 ， 那 么 shell 会 运行 env 程序 。env 程序 的 

















在 Python 3.3 程序 中 运行 























第 1 个 参数 所 指定 的 Python 文件 。 














shell 的 PATH 中 并 且 拥 有 x 可 执行 权限 。shell 打开 文件 找到 #1! 字 节 。shell 读 取 这 行 的 剩 














余部 分 并 找到 一 个 新 的 命令 : /usr/bin/env python3.3。 

















2. shell 解析 新 的 /usr/bin/enyv 命令 ， 这 个 文件 是 可 执行 的 二 进 制 文件 。 所 以 ，shell 启动 这 














的 一 部 分 提供 给 Python。 


[Se 


Python 将 从 这 个 取 自 原始 命令 


这 些 最 开始 的 选项 。 第 1 个 参 








分 别 保存 在 sys .argv 中 。 






































个 程序 。 然 后 ， 这 个 程序 启动 python3 .3。 原 来 命令 行 中 的 单词 序列 作为 操作 系统 API 














行 正 








行 中 的 单词 中 提取 第 1 个 参数 前 的 所 有 选项 。Python 会 使 用 
数 是 要 运行 的 文件 名 。 这 个 文件 名 参数 和 所 有 其 他 的 单词 会 
































runpy 模块 启动 我 们 的 应 用 程序 。 这 些 脚 本 文件 可 能 都 





























程序 可 以 使 用 os .environ ! 














5. 我 们 的 应 用 程序 可 以 用 sys .argv 解析 选项 ， 用 argparse 模块 解析 参数 。 我 们 的 应 用 


















































常 的 启动 操作 。 由 于 我 们 使 用 了 -s 选项 ， 因 此 Python 可 能 
径 一 一 sys .path。 如 果 我 们 使 用 -m 选项 ，Python 将 用 





























会 被 编译 成 字 节 码 。 















































的 更 多 信息 ， 可 参见 第 13 章 “ 配 置 文件 和 持久 化 ”。 
如 果 没 有 提供 文件 名 ，Python 解释 器 会 从 标准 输入 中 读 取 。 
的 术语 中 被 称 为 TTY)， 那 么 Python 会 进入 Read-Execute-Print Loop (REPL) 并 且 显 示 >>> 提 示 符 。 当 
作为 开发 者 时 会 经 常 使 用 这 种 模式 ， 但 是 通常 不 会 在 最 终 的 应 ) 
另外 一 种 可 能 是 标准 输入 是 一 个 习 











































































































上 
的 环境 变量 。 它 也 可 以 解析 配置 文件 ， 更 多 关于 这 个 主题 















































如 果 标 准 输入 是 命令 行 〈 在 Linux 
















































































E 定 问 








程序 中 使 用 这 种 模式 。 
的 文件 ， 例 如 ，Python <some fileor some app | 
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python。 这 两 种 输入 都 是 正确 的 ， 但 是 可 能 让 人 难以 理解 。 


参数 和 选项 


为 了 能 够 运行 程序 ，shell 将 命令 行 解析 为 一 串 单词 。 所 有 已 经 启动 的 程序 都 可 以 使 用 这 串 单词 。 
通常 ， 第 1 个 单词 是 为 了 让 shell 可 以 理解 命令 。 命 令 行 中 其 余 的 单词 被 理解 为 选项 和 参数 。 
有 若干 用 于 处 理 选项 和 参数 的 准则 ， 下 面 这 些 是 基本 的 规则 。 
@ ”选项 先 出 现 。 它 们 以 -或 -- 为 前 级 。 有 两 种 格式 : -letter 和 --word。 有 两 种 选项 ， 带 参 
选项 和 无 参 选 项 。 无 参 选项 的 例子 是 用 -V 或 者 --version 显示 版 本 。 带 参 选 项 的 一 个 参 
数 是 -m module，-m 选项 后 面 必须 带 有 一 个 模块 名 。 
@ 不 带 参 数 的 短 格式 (单一 字母 ) 选项 可 以 组 合 在 单个 的 -之 后 。 方便 起 见 , 我 们 可 以 用 -bqv 
作为 -b -q -v 选项 的 组 合 。 
@ 参数 最 后 出 现 。 它 们 没有 前 置 的 -或 者 --。 有 两 种 常用 的 参数 。 
4 对 于 位 置 参数 ， 位 置 是 有 意义 的 。 我 们 可 能 有 两 个 这 样 的 位 置 参 数 : 一 个 输入 文件 名 
和 一 个 输出 文件 名 。 这 个 顺序 很 重要 是 因为 输出 文件 会 被 修改 。 当 涉及 覆盖 文件 的 操 
作 时 ， 通 过 位 置 进行 简单 的 区 分 需要 非常 小 心 ， 因 为 可 能 会 引起 混乱 。 
4 ”参数 列表 ， 这 些 参数 在 语义 上 是 平等 的 。 我 们 可 能 有 一 些 代表 输入 文件 名 的 参数 。 这 种 
方式 适合 shell 匹配 文件 名 。 当 我 们 说 process .py *.html 时 ，shell 会 将 * .html 命 
令 扩 展 为 代表 文件 名 的 位 置 参数 。( 这 在 Windows 中 无 法 工作 , 所 以 必须 使 用 glob 模块 。) 
除了 上 面 这 些 规 则 外 ， 还 有 一 些 细节 没有 介绍 。 关 于 命令 行 选项 的 更 多 信息 ， 可 以 参考 
http://pubs.opengroup.org/onlinepubs/9699919799/basedefs/V1 chapl2.html#tag_ 
12_02。Python 的 命令 行 包 含 超过 12 种 选项 可 以 用 于 控制 Python 中 一 些 行为 的 细节 。 如 果 想 知道 
这 些 选 项 是 什么 ， 可 参见 Python Setup and Usage 文档 。 位 置 参 数 对 于 Python 命令 行 而 言 是 需要 运 
行 的 脚本 的 名 称 ， 这 是 我 们 的 应 用 程序 中 最 顶层 的 文件 。 























































































































































































































































































































































































































































































































16. 2 用 argparse 解析 命令 行 





通常 ， 使 用 argparse 包含 以 下 4 个 步 又 。 
1. 创建 ArgumentParser。 这 里 ， 我 们 可 以 为 你 提供 命令 行 接口 的 总 体 信 息 ， 包 括 描述 、 
改变 已 显示 选项 、 参 数 的 格式 和 -ph 是 否 作 为 “帮助 ”选项 。 通 常 ， 我 们 只 需要 提供 描述 ， 
其 他 的 选项 都 有 合理 的 默认 值 。 
2. 定义 命令 行 选项 和 参数 。 可 以 通过 用 ArgumentParser.add argument () 方法 函数 添加 
3. 通过 解析 sys .argv 命令 行 创建 用 于 描述 选项 、 选 项 参数 和 总 体 命 令 行 参数 的 命名 空间 对 象 。 
4. ”用 创建 好 的 命名 空间 对 象 配 置 应 用 程序 和 处 理 参数 。 有 很 多 其 他 的 方法 可 以 优雅 地 处 理 这 
个 过 程 ， 它 包括 解析 配置 文件 和 命令 行 参数 。 我 们 会 介绍 其 中 的 一 些 设计 。 
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argparse 的 一 个 重要 功能 是 它 为 我 们 提供 了 统一 的 选项 和 参数 的 接口 。 选 项 和 参数 的 主要 不 
同 是 它们 可 以 出 现 的 次 数 。 选 项 是 可 选 的 ， 所 以 可 以 出 现 零 次 或 多 次 。 参 数 通常 出 现 一 次 或 多 次 。 
我 们 可 以 简单 地 通过 下 面 的 代码 创建 解析 器 。 












































parser = argparse.ArgumentParser( description="Simulate Blackjack" ) 
我 们 提供 了 描述 ， 因 为 这 个 选项 没有 合适 的 默认 值 。 下 面 是 为 应 用 程序 定义 命令 行 API 的 一 些 
模式 。 
@ 简单 的 on-off 选项 : 我 们 通常 会 将 这 种 选项 视 为 一 个 -v 或 者 --verbose 选项 。 
@ ” 带 参 数 选项 : 这 可 能 是 -s '，' 或 者 -separator '|' 选 项 。 

@ 位 置 参 数 : 当 我 们 需要 将 输入 文件 和 输出 文件 作为 命令 行 参数 时 可 以 使 用 。 
@ ”所 有 其 他 参数 : 当 我 们 有 许多 输入 文件 时 可 以 使 用 。 
@ 

@ 
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--yersion: 用 于 显示 版 本 号 和 退出 的 特殊 选项 。 
--help: 这 个 选项 会 显示 帮助 和 退出 。 这 是 默认 行为 ， 我 们 不 需要 对 这 个 行为 做 任何 实现 。 
旦 定义 了 参数 ， 就 可 以 解析 和 使 用 它们 。 下 面 演示 了 我 们 是 如 何 解析 它们 的 。 


















































config= parser.parse _ args () 


config 对 象 是 argparse .Namespace 对 象 ， 这 个 类 和 types .SimpleNamespace 类 似 。 
它 本 身 包含 许多 属性 ， 我 们 也 可 以 很 容易 地 将 更 多 的 属性 添加 到 这 个 对 象 中 。 

我 们 会 逐一 介绍 这 6 种 常用 的 参数 ArgumentParser 类 中 有 许多 聪明 成 熟 的 选项 可 以 使 
用 。 它 们 中 的 大 多 数 已 经 超出 了 通常 的 命令 行 参数 处 理 的 简单 准则 。 通 和 常 ， 我 们 应 该 避免 使 
用 一 些 使 描述 程序 变 得 非常 复杂 的 选项 ， 例 如 findq。 当 选项 变 得 很 复杂 时 ， 我 们 可 能 已 经 不 
知 不 觉 地 在 Python 之 上 创建 了 领域 特定 语言 。 为 什么 不 直接 使 用 Python 呢 ? 


16.2.1 简单 的 on/off 选项 

我 们 会 用 单个 字母 的 短 名 称 来 定义 一 个 简单 的 on-off 选项 ,也 可 以 提供 一 个 更 长 的 名 称 ， 还 应 
该 提供 一 个 显 式 的 操作 。 如 果 和 忽略 更 长 的 名 称 或 者 更 长 的 名 称 不 适合 作为 Python 的 变量 ， 我 们 可 
能 会 希望 提供 一 个 目标 变量 。 














































































































































































































parser.add argument ( '-v', '--verbose', action='store true', default-False ) 
这 会 定义 命令 行 选项 的 长 版 本 和 短 版 本 。 如 果 用 户 输入 了 选项 ， 它 会 将 verbose 选项 设 为 
True。 如 果 用 户 没有 提供 选项 ，versbose 选项 默认 为 False。 下 面 是 该 选项 的 一 些 常 见 变化 。 
@ 我 们 可 能 将 action 改 为 'store false' 并 将 默认 值 设 为 True。 
@ 有 时候， 我 们 可 能 会 用 None 作为 默认 值 ， 而 不 是 True 或 者 False。 
@ 有 时候 ， 我 们 会 使 用 'store_const' 作 为 action， 并 且 包 含 一 个 额外 的 const= 人 参数。 
这 让 我 们 可 以 保存 除了 简单 的 布尔 值 之 外 的 其 他 值 ， 例 如 日 志 级 别 或 者 其 他 对 象 。 
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@ 可 能 也 会 用 'count ' 作 为 action， 这 样 使 得 该 选项 可 以 重复 并 能 够 递增 count 的 值 。 
在 这 种 情况 下 ， 默 认 值 通常 是 0。 
如 果 我 们 使 用 日 志 记录 器 ， 可 能 会 用 类 似 下 面 的 代码 来 定义 调试 选项 。 


parser.add argument ( '--qebug'，action='store const', const=logging. 
DEBUG, default=logging.INFO, dest="logging level" ) 


























































































































我 们 将 action 改 为 store_const， 这 意味 着 常量 将 被 保存 并 提供 logging. DEBUG 的 某 个 
特定 常量 。 这 意味 着 生成 的 选项 对 象 可 以 直接 为 配置 根 日 志 记 录 器 提供 需要 的 值 。 然后 ， 可 以 简单 地 将 
日 志 记 录 器 配置 为 使 用 config.logging level， 而 不 必 再 使 用 任何 的 匹配 或 者 条 件 处 理 过 程 。 


16.2.2” 带 参数 选项 


我 们 会 定义 一 个 长 名 称 和 可 选 短 名 称 的 带 参 选项 。 我 们 会 定义 一 个 用 于 保存 参数 提供 的 值 的 
action。 我 们 也 可 以 提供 一 个 类 型 转换 ， 以 便 希 望 把 字符 串 转 换 为 float 或 者 int 值 。 

































































































































































parser.add argument ( "-b", "--bet", action="store", default="Flat", 
choices=["Flat", "Martingale", "OneThreeTwoSix"], dest='betting rule') 
parser.add argument ( "-s", "--stake", action="store", default=50, 
type=int ) 








| 





第 1 个 例子 定义 了 两 个 版 本 的 命令 行 语法 ,包括 长 版 本 和 短 版 本 。 当 解析 命令 行 参数 值 时 ， 选 
项 之 后 必须 带 有 一 个 字符 串 值 , 并 且 它 必须 来 自 于 可 用 的 cnoices。 目标 名 称 betting rule 
会 接收 选项 的 参数 字符 串 。 

第 2 个 例子 也 定义 了 两 个 版 本 的 命令 行 语 法 ， 它 包含 了 一 个 类 型 转换 。 当 解析 参数 值 时 ， 这 个 
语法 会 保存 选项 之 后 的 整数 。 长 名 称 stake 会 成 为 解析 器 创建 的 选项 对 象 的 值 。 

在 某 些 情况 下 ， 会 有 一 些 和 参数 相关 的 值 。 在 本 例 中 ， 我 们 可 以 提供 一 个 将 空格 分 隔 的 多 个 值 
整合 为 一 个 列表 的 nargs="+" 选 项 。 


16.2.3 ”位 置 参 数 


我 们 用 不 带 "-" 装 饰 的 名 称 来 定义 位 置 参 数 。 对 于 固定 数量 位 置 参 数 的 情况 ， 我 们 会 将 它们 添 
加 进 解析 器 中 。 


parser.add argument ( "input filename", action="store" ) 





















































































































































































































































parser.add argument ( "output filename", action="store" ) 

当 解 析 参 数值 时 ， 这 两 个 位 置 参 数字 符 串 会 保存 在 最 终 的 命名 空间 对 象 中 。 我 们 可 以 用 
config.input filename 和 config.output filename 访问 这 些 参数 值 。 

16.2.4 所 有 其 他 参数 


我 们 用 不 带 有 "- "装饰 的 名 称 来 定义 参数 列表 ,并 且 用 nargs= 变 量 提供 建议 信息 。 如 果 包 含 一 个 
或 者 多 个 参数 值 ， 我 们 指定 nargs="+"。 如 果 包 含 零 个 或 者 多 个 参数 值 ， 我 们 指定 nargs="+"。 如 
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果 参 数 是 可 选 的 ， 我 们 指定 nargs="?"。 这 会 将 所 有 其 他 参数 的 值 作为 一 个 单 
后 生成 的 命名 空间 对 象 中 。 
parser.add _ argument ( "filenames", action="store", nargs="*", metavar="file..." ) 

当 文件 名 列表 是 可 选 的 时 ， 它 通常 意味 着 如 果 没 有 提供 特别 的 文件 名 就 会 使 用 STDIN 或 者 STDOUT。 
如 果 我 们 指定 了 nargs=， 那 么 生成 的 结果 就 是 一 个 列表 。 如 果 我 们 指定 nargs=1， 那 么 生 
成 的 对 象 就 是 只 包含 一 个 元 素 的 列表 。 如 果 我 们 忽略 nargs， 那 么 结果 就 是 用 户 提供 的 单一 值 。 
创建 一 个 列表 (即使 它 只 包含 一 个 元 素 ) 会 为 我 们 提供 很 多 方便 ， 因 为 我 们 可 能 希望 用 下 面 的 
方式 来 处 理 参数 。 


for filename in config.filenames: 
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由 的 序列 保存 在 最 












































































































































































































































process( filename ) 
在 某 些 例子 中 ， 我 们 可 能 希望 提供 一 些 包 含 STDIN 的 输入 文件 。 这 种 需求 的 通用 作法 是 将 - 文 
件 名 作为 参数 。 我 们 必须 在 应 用 程序 中 以 类 似 下 面 的 方式 来 处 理 这 种 需求 。 


for filename in config.filenames: 
















































































if filename == "一 : 
Process (Sys.stqdqin) 
else: 
with open(filename) as input: 
process (input) 


这 段 代 码 试图 处 理 多 个 文件 名 ， 有 可 能 包括 -来 显示 什么 时 候 应 该 在 文件 列表 中 处 理 标 准 输入 。 
我 们 可 能 会 将 with 语句 放 在 try: 块 中 。 
16.2.5“”--version 的 显示 和 退出 

于 显示 版 本 号 的 选项 经 常 被 使 用 ， 因 此 我 们 可 以 用 下 面 的 快捷 方式 显示 版 本 信息 。 


parser.add argument ( "-V", "--version", action="version", version= version  ) 


这 个 例子 假设 在 文件 的 某 个 地 方 我 们 定义 了 一 个 全 局 模块 。version = "3.3.2"， 这 个 特殊 
的 action="version" 的 副作用 是 在 显示 了 版 本 信息 之 后 会 退出 程序 。 


16.2.6”--help 的 显示 和 退出 

显示 帮助 的 选项 是 argparse 模块 的 默认 功能 。 另 外 一 种 特殊 情况 允许 我 们 通过 -ph 或 --help 
的 默认 设置 改变 help 选项 。 这 需要 两 样 东西 。 首 先 ， 我 们 必须 创建 一 个 add_hnelp=False 的 解 
析 器 。 这 会 禁用 内 置 的 -hn、--help 功能 。 这 么 做 了 之 后 ， 会 添加 一 个 action="help"， 指 定 
我 们 想 用 的 参数 〈 例 如 ，'"-?')。 这 会 显示 帮助 文本 并 且 退 出 。 
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环境 变量 的 一 般 规则 是 ， 它 们 和 命令 行 选项 及 参数 类 似 ， 属 于 配置 输入 。 在 大 多 数 情况 下 ,我 们 将 很 











少 更 改 的 设置 保存 为 环境 变 
这 样 每 次 我 们 登录 时 ， 对 





weal 
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通常 ， 我 们 会 通过 .bashrc 或 者 .bash profile 文件 设置 它们 ， 























/etc/bashrc 文件 中 ， 这 村 


EF 它们 就 会 应 | 








是 这 些 设 置 



























































只 会 保存 到 会 话 结束 之 前 



























































咏 的 值 都 会 被 更 新 。 我 们 可 以 考虑 将 环境 变量 设置 在 更 全 








局 的 

















于 所 有 的 用 户 。 我 们 也 可 以 用 


on 

















命令 行 设置 环境 变量 ， 但 























都 可 以 在 命令 行 中 提供 。 寿 





















































































































































































































































在 某 些 情况 下 ， 我 们 所 有 的 配置 E 本 例 中 ， 环 境 变 量 可 以 作为 很 少 需 
要 被 更 改 的 变量 的 一 种 选择 。 

在 其 他 情况 下 ， 我 们 提供 的 配置 值 可 能 会 被 隔离 到 环境 变量 提供 的 设置 中 ， 这 些 设置 不 同 于 命令 
行 选项 提供 的 。 我 们 可 能 需要 从 环境 变量 中 获取 一 些 值 ， 然 后 将 这 些 值 与 来 自 于 命令 行 的 一 些 值 合并 。 

我 们 可 以 用 环境 变量 来 为 配置 对 象 设置 默认 值 。 在 解析 命令 行 参数 前 ， 我 们 希望 可 以 先 收集 这 
些 值 。 在 这 种 情况 下 ， 命 令 行 参数 可 以 覆盖 环境 变量 ， 有 两 种 常用 的 实现 方式 。 

@ ”在 定义 命令 行 参 数 时 ， 显 式 设置 值 : 这 样 做 的 优点 是 可 以 在 帮助 消息 中 显示 默认 值 。 它 只 


针对 环境 变量 和 命令 行 选项 
































个 可 以 被 覆盖 的 默认 值 。 


parser.add argument ( 


"--samples", action="store", 


default=int (os .environ.get ("SIM SAMPLES",100)), 


help="Samples to generate" ) 





type=int, 


@ 在 解析 过 程 中 隐 式 设置 值 : 这 利 

一 个 单独 的 配置 中 。 我们 可 以 J 
值 来 覆盖 它 。 这 为 我 
间 中 的 覆盖 值 和 最 后 






















































































E 合 的 情况 。 我 们 可 能 希望 用 SIM_SAMPLES 环境 变量 提供 





























方式 让 我 们 可 以 很 容易 地 将 
默认 值 先生 成 一 个 命名 空间 ， 然 后 | 





门 提供 了 3 个 级 别 的 选项 值 : 

















定义 在 解析 器 中 的 默认 值 、 

















由 命令 行 提 供 的 覆盖 值 。 











config4= argparse.Namespace () 
config4.samples= int (os.environ.get ("SIM _ SAMPLES"，100) ) 


config4a= parser.parse args( namespace=config4 


参数 解析 器 可 以 为 非 简单 字符 串 的 值 提供 类 型 转换 。 但 是， 收集 


KY 





16.3.1 提供 更 多 的 可 配置 默认 值 


) 











我 们 可 以 将 配置 文件 与 环境 变量 和 命令 行 选项 进 




























































































行 合 并 , 这 为 我 们 提供 了 3 种 为 应 用 程序 提供 


;环境 变量 和 命令 行 选项 合并 到 
j 从 命令 行 解析 生成 的 
































写 入 命名 空 




















环境 变量 不 会 自动 触发 类 型 转换 。 对 于 包含 非 字符 串 值 的 选项 ， 
我 们 必须 在 应 用 程序 中 执行 类 型 转换 。 























点 的 示例 ， 可 参见 第 13 章 “ 








配置 文 





























配置 的 方法 。 
@ 配置 文件 的 层次 结构 可 以 提供 默认 值 。 有 关 如 何 做 到 这 
件 和 持久 化 ”。 
@ ”环境 变量 可 以 提供 履 盖 配置 文件 的 方法 ,这 可 能 意味 着 需要 将 
译 为 配置 文件 的 命名 空间 。 
@ 用 命令 行 选项 定义 最 后 的 覆盖 操作 。 








个 环境 变量 的 命名 空间 翻 
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使 用 全 部 3 种 方法 可 能 不 是 一 个 好 选择 。 如 果 有 太 多 的 地 方 需要 搜索 , 追踪 








， 
个 设置 会 变 和 


























导 麻 


烦 。 最 终 决 定 使 用 哪 种 方式 提供 配置 通常 需要 与 应 用 程序 和 框架 的 总 体 结构 保持 一 致 。 我 们 应 该 努 











力 使 我 们 的 程序 和 其 他 模块 无 终结 合 。 














我 们 会 介绍 本 主题 的 两 个 小 变化 。 第 1 个 例子 向 我 们 展示 了 如 何 用 环境 变量 覆盖 配置 文人 












































置 。 第 2 个 例子 向 我 们 展示 了 如 何 用 配置 文件 覆盖 全 局 的 环境 变量 配置 。 





wo 





























16.3.2 ”用 环境 变量 覆盖 配置 文件 设置 








我 们 会 用 3 个 阶段 的 处 理 过 程 来 合并 环境 变量 ,并 赋予 它们 比 配 置 文 伯 



















































































先 ， 我们 会 从 环境 变量 中 创建 一 些 默 认 设 置 。 





env values= [ 





("attribute name", os.environ.get( "SOMEAPP VARNAME", None )), 
("another name", os.environ.get( "SOMEAPP OTHER", None )), 





EGG 


创建 类 似 这 样 的 映射 可 以 将 外 部 的 环境 变量 名 称 (SOMERAPP 








VARNAM 






































F} 设 置 更 高 的 优先 级 。 首 


EE ) 改写 为 与 我 们 的 应 用 


F 设 























程序 配置 属性 匹配 的 内 部 配置 名 称 (attribute_name)。 对 于 没有 定义 的 环境 变量 ， 会 将 None 



































作为 它们 的 默认 值 。 稍 后 我 们 会 单独 介绍 这 部 分 。 
接 下 来 ， 我 们 会 解析 配置 文件 层次 结构 来 获取 后 台 配 置信 息 。 


config name= "someapp.yaml™" 















































config locations = ( 
os.path.curdir, 
os.path.expanduser ("~/"), 
"/etc", 








os.path.expanduser ("~thisapp/"), # or thisapp. file ， 


) 





candidates = ( os.path.join(dir,config name) 
for dir in config locations ) 
config names = ( name for name in candidates if os.path.exists (name) ) 
files values = [yaml.load(file) for file in config names] 
我 们 按照 重要 性 顺序 从 高 (用 户 所 有 的 ) 到 低 (安装 文件 的 一 部 分 ) 创建 了 一 个 路 径 列表 。 对 



























































因为 它 很 灵活 并 且 容 易 理 解 。 
我 们 可 以 用 这 些 资源 建立 一 个 chainMap 对 象 的 实例 。 





defaults= ChainMap( dict( (k,v) for k,v in env Values if v is not None 


), *files values ) 





我 们 将 多 个 映射 合并 到 一 个 chainMap 中 。 程 序 会 首先 搜索 环境 变量 。 
























































中 时 ,程序 会 先 在 用 户 的 配置 文件 中 搜索 该 值 ， 如 果 用 户 配置 文 伯 
配置 文件 中 搜索 。 







































































于 每 个 确实 存在 的 文件 ， 解 析 文 件 的 内 容 ， 然 后 创建 从 名 称 到 值 的 映射 。 我 们 依赖 于 YAML 标记 ， 





























没有 提供 值 ， 导 


当 值 存 在 于 环境 变量 





了 么 会 接着 硬 
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我 们 可 以 用 下 面 的 代码 解析 命令 行 参 数 并 且 更 新 这 些 默 认 值 。 


















































config= parser.parse args( namespace=argparse.Namespace( **defaults ) ) 














我 们 将 chainMap 配置 文件 的 设置 转换 为 一 个 argparse .Namespace 对 象 。 然 后 ， 我 们 解 



























































析 命 令 行 选项 并 更 新 这 个 命名 空间 对 象 。 由 于 在 chainMap 中 环境 变量 最 先 出 现 , 因此 它们 会 覆盖 
所 有 的 配置 文件 。 





















































16.3.3 ”用 配置 文件 覆盖 环境 变量 




















一 些 应 用 程序 会 将 环境 变量 作为 可 以 被 配置 文件 覆盖 的 基础 默认 值 。 在 本 例 中 ,我 们 会 改变 创 
























































建 chainMap 的 顺序 。 在 上 面 的 例子 中 ， 我 们 将 环境 变量 放 在 第 1 个 。 我 们 可 以 将 env_config 


放 在 defaults .maps 的 最 后 ， 这 样 它 就 作为 最 后 的 选择 。 




















defaults= ChainMap( *files values ) 


defaults.maps.append( dict( (k,v) for k,v in env values if Vv is not 
None ) ) 























终于 ， 我 们 可 以 使 用 下 面 的 代码 来 解析 命令 行 参数 并 更 新 这 些 默认 值 。 

















config= parser.parse args ( namespace=argparse.Namespace( **defaults ) 


) 











我 们 将 配置 文件 设置 的 chainMap 转换 为 了 一 个 argparse .Namespace 对 象 。 然 后 ， 我 们 












































解析 命令 行 参数 来 更 新 这 个 命名 空间 对 象 。 由 于 环境 变量 位 于 chainMap 的 最 后 , 它们 会 提供 任何 











配置 文件 中 所 缺少 的 值 。 









































16.3.4 ”让 配置 文件 理解 None 























这 个 三 阶段 设置 环境 变量 的 过 程 包含 许多 常见 的 参数 和 配置 项 的 设置 。 我 们 并 非 总 是 需要 环境 




















恋 是 


























量 、 配 置 文件 和 命令 行 参 数 。 一 些 应 用 程序 可 能 只 需要 使 用 这 些 技术 中 的 一 小 部 分 。 






































我 们 会 经 常 需要 保留 None 值 的 类 型 转换 。 保留 None 值 可 以 确保 我 们 能 知道 还 没有 设置 环境 变 







































































EH 




















下 面 是 一 个 更 完整 的 类 型 转换 方式 ， 它 是 None-aware 的 。 








def nint( x ): 
if x is None: return x 


return int (x) 











我 们 可 以 在 下 面 的 上 下 文中 使 用 这 个 nint () 转换 方法 来 获取 环境 变量 。 


env values= [ 
('samples', nint (os.environ.get ("SIM SAMPLES", None)) )， 
('stake', nint (os.environ.get( "SIM STAKE", None )) )， 
('rounds', nint (os.environ.get( "SIM ROUNDS", None )) )， 








] 


















































如 果 茶 个 环境 变量 没有 被 设置 ， 就 会 使 用 None 作为 默认 值 。 如 果 环 境 变 量 已 经 设置 ， 那 么 这 个 值 
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会 被 转换 为 一 个 整数 。 在 后 面 的 处 理 步骤 中 ， 我 们 可 以 基于 None 值 用 非 None 的 正确 的 值 来 创建 字典 。 


16.4 自 定 义 帮助 文档 的 输出 


下 面 是 argparse.print_help() 直接 打印 的 一 些 典 型 输出 。 


usage: p3 cl6.py [-v] [--debug] [--dealerhit {Hit17,Standl7}] 
-resplit {ReSplit,NoReSplit,NoReSplitAces}] 









































[--decks DECKS] 
—-limit LIMIT] [--pPayout PAYOUT] 

-p {SomeStrategy,AnotherStrategy}] 

-b {Flat,Martingale,OneThreeTwoSix}] [-r ROUNDS] [-s 





STAKE 








-samples SAMPLES] [-V] [-?] 
output 


Simulate Blackjack 


positional arguments: 
output 


optional arguments: 

-VvV, -Verbose 

——-debug 

——-dealerhit {Hit17,Standl7} 

-resplit {ReSplit,NoReSplit,NoReSplitAces} 

-decks DECKS 

——-limit LIMIT 

-payout PAYOUT 

-p {SomeStrategy,AnotherStrategy}, -~-playerstrategy 
{SomeStrategy,AnotherStrategy} 

-b {Flat,Martingale,OneThreeTwoSix}, --bet {Flat,Martingale,OneThre 





eTwoSix} 
-rr ROUNDS, -rounds ROUNDS 
-Ss STAKE, -stake STAKE 
—--samples SAMPLES 
-V, —-version show program's version number and exit 
0 heltp 


默认 的 帮助 文本 是 基于 解析 器 定义 的 4 个 方面 创建 的 。 
@ usage 行 是 选项 的 摘要 。 我 们 可 以 用 自己 的 usage 文本 蔡 换 默认 的 ， 这 样 就 可 以 省 略 
些 不 常用 的 细节 。 
































































































































































































































@ 接 下 来 是 描述 信息 。 在 默认 情况 下 ， 我 们 提供 的 文本 会 被 适当 清理 一 下 。 在 本 例 中 ， 我 们 
提供 了 只 有 两 个 单词 的 描述 ， 所 以 没有 明显 的 清理 操作 。 
然后 ， 显 示 参 数 。 首 先是 位 置 参 数 ， 然 后 是 选项 ， 和 它们 定义 的 顺序 一 致 。 
会 





在 这 之 后 ， 会 显示 一 段 可 选 的 结束 文本 。 














在 二 些 











情况 下 , 这 种 简短 的 提示 就 足够 了 。 





关于 包含 更 多 细节 的 帮助 文本 ， 我 们 有 3 层 的 支持 。 


@ 在 参数 定义 中 添加 


过 formatter_class= 参 数 完成 的 。 











~ 


help=: 









































16.5 


但 是 , 在 其 他 情况 下 , 我 们 可 能 需要 











自 定义 帮助 文本 的 























节 时 ， 


注意 ， Argument 





需要 从 这 里 
@ 用 某 个 其 他 的 帮助 文本 格式 化 类 创建 更 美观 的 输出 : 这 是 在 创建 ArgumentParser 时 ， 
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提供 更 多 细节 。 

















开始 。 
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DefaultsHelp Formatter 需 
































要 为 参数 定义 提供 help=， 它 会 将 所 提供 的 文本 作为 默认 值 添加 到 帮助 文本 中 。 
@ 扩展 ArgumentParser 类 并 且 履 盖 print_usage0 和 print_help() 方 法 : 总 是 可 以 创建 一 个 新 
的 帮助 文本 格式 化 器 。 如 果 必 须 选 择 这 么 复杂 的 选项 ， 那 么 可 能 已 经 走 的 远 了 。 
我 们 的 目标 是 提高 可 用 性 。 即 使 应 用 程序 能 够 正常 工作 ， 也 可 以 通过 提供 命令 行 的 支持 让 程序 
更 容易 被 使 用 从 而 建立 用 户 的 信任 。 

















16.5 创建 顶层 main () 范 








在 第 13 章 “ 配 置 文件 








映射 降级 为 mainl 
在 前 面 的 部 分 中 ， 我们 


























和 持久 化 ”: 


数 


， 我 们 介 














全 局 特性 映射 : 在 前 面 的 例子 中 ， 我 
现 了 全 局 特性 映射 。 
对 象 创建 : 对 象 创建 的 目的 是 基于 配置 参数 创建 需要 的 对 象 实例 ， 
































) 函数 中 的 局 部 特 掀 





























绍 了 两 个 应 用 程序 配置 设计 模式 。 
门 用 ArgumentParser 创建 的 Namespace 对 象 实 




















映射 并 





























向 你 展示 的 是 使 ) 


















































不 会 保存 特性 。 
局 部 的 Name space 对 象 来 收集 所 有 








实际 上 就 是 将 全 局 特性 




















的 参数 。 从 这 里 开始 ， 
设计 模式 不 是 对 立 的 ， 而 是 














Ea 
VN 


我 们 可 以 创建 必要 的 
互补 的 。 我 们 | 

















ij Namespace 





用 程序 对 




















这 样 我 
的 名 字 ， 有 两 种 方法 可 以 命 
命名 它 为 main () 











@ 不 要 命名 为 main () 





门 就 需要 为 顶层 也 





数 进行 设计 。 


名 这 个 函数 。 





象 , 它们 将 会 做 真正 的 应 用 程序 工作 。 这 两 利 
收集 一 组 一 致 的 值 ， 然 后 基于 这 个 Name space ! 





























在 介 





绍 实 纪 


























纲 

















LY 
~ 





， [大 





这 是 作为 整个 应 


， 因 为 main () 不 明确 ， 








程序 起 点 的 通 








用 术语 。 
所 以 从 长 远 来 看 没有 意义 。 




















Ce 
方法 之 前 , 我 们 需要 为 这 个 函数 起 一 





我 们 也 认为 这 里 


























应 ) 





























重新 为 main 分 配 名 称 。 











不 需要 二 选 一 ， 我 们 应 该 同时 做 到 
顶层 函数 很 好 地 描述 了 操作 。 增 加 一 行 main= verb noun 来 提供 一 个 可 以 帮助 其 他 3 
程序 工作 方式 的 main () 函数 。 


这 个 包含 两 个 部 分 的 实现 使 得 我 们 5 




















] 可 以 通过 








作为 维 











持 程序 稳定 和 


下 面 是 一 个 顶层 的 应 用 程序 脚本 ， 


import ast 


import csv 











def simulate blackjack ( config ) : 


dealer rule= {'Hit17"': 


Hit17y 


'Stand17' 





扩展 来 改变 main () 
日 益 增 加 的 API 的 需要 ， 老 的 函数 名 仍然 被 保留 。 
它 基于 配置 Namespace 对 象 创 建 多 个 对 象 。 


以 上 两 点 。 定 义 一 个 名 为 verb_noun ( 





的 定义 。 我 们 可 


0 短语 的 
开发 者 了 解 

















以 添加 函数 3 








: Stand17,} [config.dealer rule] () 
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split rule= {'ReSplit': ReSplit, 'NoReSplit': NoReSplit, 'NoReSplitAces': 
NoReSplitAces, 
} [config.split rulel] () 


Ey 
payout= ast.literal eval( config.payout ) 


assert len (payout) 


except Exception as e: 
raise Exception( "Invalid payout {0}".format (config.payout) ) 





from e 
table= Table( decks=config.decks, limit=config.limit, 
dealer=dealer rule, 
split=split rule, payout=payout ) 
player rule= {'SomeStrategy': SomeStrategy, 
'AnotherSstrategy': AnotherSstrategy,} [config.player rule] () 
betting rule= {"Flat":Flat,"Martingale":Martingale, "OneThreeTwoSix": OneThreeTwoSix, 





} [config.betting rule] () 
player= Player( play=player rule betting=betting rule, 


rounds=config.rounds, stake=config.stake ) 


simulate= Simulate( table, player, config.samples ) 
"w", newline="") as target: 





with open(config.outputfile, 
wtr= csv.writer( target ) 
wtr.writerows( simulate ) 





Bs 








为 它 没有 被 命名 为 main () ， 所 


















































这 个 函数 依赖 于 外 部 通过 配置 属性 提供 的 Namespace 对 象 。 
以 我 们 将 来 可 以 把 它 改 为 和 main 意义 不 同 的 函数 。 
我 们 创建 多 个 所 需 的 对 象 一 一 Table、Player 和 Simulate。 将 基于 配置 参数 的 初始 值 为 这 






































些 对 象 进 行 配置 。 
有 实 上 ，, 我们 已 经 完成 了 实际 工作 。 在 所 有 的 对 象 创 建 完成 后 , 真正 的 工作 是 那 行 突出 显示 的 : 
旦 序 90% 的 时 间 都 会 花 在 这 里 ， 生 成 示例 并 且 将 它们 写 入 需求 












































I 











hil 























wtr.writerows ( simulate ) 。 种 















































的 文件 中 。 
GUI 应 用 程序 也 遵循 类 似 的 模式 ， 它 们 进入 主 循 环 来 处 理 GUI 事件 ， 这 个 模式 也 可 以 应 用 于 
进入 主 循环 处 理 请 求 的 服务 器 。 




















页 层 的 simulate_ 



































门 依赖 于 需要 将 配置 对 象 作为 参数 传递 。 这 是 减少 依赖 项 的 测试 策略 。 这 个 了 






































我 人 
blackjack () 函数 不 依赖 于 配置 创建 的 细节 。 然 后 ， 我 们 可 以 在 应 用 程序 脚本 中 使 用 这 个 函数 。 
if _name == " main ";: 
| .load ("logging.config") ) 








logging.config.dictConfig( yam] 
config5= gather configuration () 
simulate blackjack( config5 ) 
logging.shutdown () 
这 是 业务 间 关 系 分 离 的 做 法 。 我 们 将 应 用 程序 的 工作 舱 套 进 两 个 层次 的 模块 中 。 
外 层 的 模块 通过 日 志 定义 。 我 们 在 所 有 其 他 应 用 程序 模块 的 外 部 定义 了 日 志 记 录 机 制 ， 这 样 做 
是 为 了 确保 在 不 同 的 顶层 模块 、 类 和 函数 试图 配置 日 志 记录 机 制 时 没有 冲突 。 如 果 应 用 程序 的 任何 


特定 部 分 尝试 配置 日 志 记 录 机 制 ， 那 么 这 样 的 修改 会 导致 冲突 。 尤 其 是 ， 当 我 们 介绍 将 应 用 程序 融 
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合成 更 大 的 复合 处 理 单 元 时 ， 需 要 确保 这 两 个 被 融合 的 应 用 程序 不 会 导致 日 志 记录 配置 的 冲突 。 

内 层 的 模块 是 通过 应 用 程序 配置 定义 的 。 我 们 不 希望 独立 的 应 用 程序 模块 间 有 冲突 ,而 是 希望 
允许 命令 行 API 在 不 影响 应 用 程序 的 前 提 下 演化 。 我 们 希望 可 以 将 应 用 程序 的 处 理 流 程 庶 入 独立 
的 环境 中 ， 可 能 通过 multiprocessing 或 者 一 个 RESTful 网 络 服务 器 来 定义 。 


16.5.1 “确保 配置 遵循 DRY 原则 
在 参数 解析 器 的 创建 和 使 用 参数 配置 应 用 程序 之 间 ， 可 能 会 有 违背 DRY 的 地 方 。 我 们 用 一 些 重 
复 的 键 创建 参数 。 
我 们 可 以 通过 创建 一 些 全 局 内 部 配置 消除 这 种 重复 。 例 如 ， 我 们 可 能 这 样 定义 全 局 配置 。 
dealer rule map = { "Hit17": Hit1l7, "Standl7", Standl7 } 
我 们 可 以 用 它 来 创建 参数 解析 器 。 


parser.add argument ( "--dealerhit", action="store", default="Hit17", 


















































































































































































































































choices=dealer rule map.keys(), dest='dealer rule') 


我 们 可 以 用 它 创 建 工作 对 象 。 


dealer rule= dealer rule maplconfig.dealer rule] () 


这 种 做 法 消除 了 重复 。 当 程序 持续 演变 时 ， 它 多 许 我 们 在 茶 处 添加 新 的 类 定义 和 参数 键 映 射 ， 
它 也 允许 我 们 像 下 面 这 样 创建 外 部 API 的 简写 形式 或 者 重 写 外 部 API。 


dealer rule map = { "H17": Hit17, "S17": Standl7 } 

从 命令 行 (或 配置 文件 ) 字符 串 到 应 用 程序 类 的 映射 有 4 种 类 型 。 使 用 这 些 内 置 的 映射 可 以 简 
化 simulate_blackjack() 函数 。 
16.5.2 管理 嵌 套 的 配置 上 下 文 

在 某 种 程度 上 ， 藤 套 上 下 文 的 出 现 意味 着 顶层 的 脚本 看 起 来 应 该 类 似 下 面 的 代码 。 


if name == " main ": 











































































































with Logging Config(): 
with Application Config() as config: 
simulate blackjack( config ) 


我 们 添加 了 两 个 上 下 文 管理 器 。 更 多 的 信息 ， 参 见 第 5 章 “ 可 调 
是 两 个 上 下 文 管理 器 。 


class Logging Config: 














> 
































对 象 和 上 下 文 的 使 用 








。 下 面 


















































def _enter ( self, filename="logging.config" ) : 





logging.config.dictConfig( yaml.load(filename) ) 
def exit ( self, *exc ): 
logging.shutdown () 
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闭 日 志 。 
Application Config 上 下 文 管理 
在 本 例 中 ， 使 用 上 下 文 管 





的 设计 可 能 有 点 复杂 ， 但 是 这 和 


class Application Config: 


ge 大 一: 





nter ( 


# Load files. 


self 
# Build os.environ defaults. 


) 


# Build ChainMap from environs and files. 


# Parse command-line arguments. 


return namespace 


def exit ( 
pass 


Logging_ Config 上 下 文 管理 器 配置 





























这 种 设计 模式 可 能 明确 国 








self, 


人 六 外 






























































渐 增 长 ， 它 也 会 为 我 们 提供 很 多 帮助 。 


更 改 的 应 











当面 对 持续 增长 和 扩展 的 应 | 



































程序 处 理 上 下 文 与 很 少 更 改 的 处 天 


器 可 以 从 一 系列 的 文件 


日 志 记 录 。 它 同时 也 确保 了 当 应 用 程序 结束 时 会 正确 









































里 器 不 是 必需 的 。 但 是 ， 使 用 它 为 我 们 
绕 应 用 程序 启动 和 关闭 的 各 种 关系 。 
设计 与 Python 中 上 下 文 管理 


























器 的 思想 一 致 ， 同 时 随 





中 获取 配置 信息 和 命令 行 参 数 。 
留 下 了 可 扩展 的 余地 。 
尽管 对 于 大 多 数 应 用 程序 ， 这 样 


上 
下 必用 性 



















































































j 程 序 时 ， 我 们 通常 会 使 用 大 规模 编程 技术 。 对 于 这 种 技术 ， 将 可 























16.6 大 规模 程序 设计 


el 
EE 





让 我 们 在 21 点 模拟 程序 ! 








添加 一 个 功能 : 








@ 添加 一 个 函数 。 


@ ”使 用 命令 模式 。 

















上下文 分 离 是 非 请 


























要 的 。 





分 析 结 果 。 我 们 有 许多 方式 来 实现 这 个 新 添加 的 功 




















。 我 们 的 考虑 包括 两 个 维度 ， 这 带 来 了 大 量 的 组 合 。 考 虑 其 中 





另 一 个 维度 是 如 何 包装 新 的 功能 。 




















@ 编写 一 个 新 的 顶层 脚本 文本 。 我 们 会 基于 文 们 
创建 新 的 命令 。 
@ 添加 一 个 新 的 参数 到 应 用 程序 ， 




















simulate 和 app.py analyze 的 命令 。 
这 4 种 组 合 都 是 实现 这 个 功能 的 合适 方式 。 我 们 会 专注 于 使 朋 















































F 的 名 称 ， 比 如 





允许 脚本 执行 模拟 或 站 

















分 析 功 能 。 





个 维度 是 如 何 设计 新 功能 。 














simulate.py 和 analyze.py， 


我 们 会 有 类 似 于 app.py 











现 有 的 应 用 程序 修改 为 使 用 命令 设计 模式 。 然 后 ， 会 通过 添加 功 




















16.6.1 
许多 应 用 程序 都 隐 式 使 用 了 命令 设计 模式 。 


设计 命令 类 





三 

















Ti 女 


用 程序 可 能 只 包含 


























三 用 本 








定义 应 用 程序 如 何 转换 、 创 建 或 者 使 ) 
个 实现 为 一 个 函数 的 动词 。 这 种 情况 下 ， 使 ) 





毕竟 ， 

















我 们 在 处 理 数据 。 为 了 使 ) 
数据 的 主动 词 (active-voice verb )。 人 简单 的 应 


上 命令 设计 模式 。 首 先 ， 我 们 会 将 
的 方式 扩展 应 用 程序 。 
































j 这 种 模式 ， 至 少 





















































j 命 令 类 设计 模式 可 能 没有 帮助 。 
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更 复杂 的 应 用 程序 会 包含 多 个 相关 的 动词 。GUI 应 用 程序 和 Web 服务 器 的 一 个 主要 功能 就 是 它们 
可 以 完成 多 项 工作 、 执 行 多 个 命令 。 在 许多 情况 下 ，GUI 的 菜单 选项 定义 了 应 用 程序 的 动词 领域 。 
在 一 些 情况 下 ， 设 计 应 用 程序 是 从 分 解 一 个 更 大 、 更 复杂 的 动词 开始 的 。 我 们 可 以 把 全 局 的 处 
理 过 程 分 解 为 几 个 更 小 的 命令 步 又， 然后 将 这 些 步 又 合并 成 最 终 的 应 用 程序 。 
当 研 究 应 用 程序 的 演变 时 ， 我 们 经 常会 看 到 这 样 一 种 模式 一 一 新 的 功能 与 当前 应 用 程序 合并 。 
在 这 些 情况 下 ， 每 个 新 的 功能 都 可 以 成 为 添加 到 应 用 程序 类 层次 中 的 一 种 独立 的 命令 子 类 。 
下 面 是 抽象 的 命令 基 类 。 


class Command: 
def set config( self, config ) : 
self. dict .update( config. dict  ) 
config= property( fset=set config ) 
def run( self ): 
pass 
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我 们 通过 将 config 属性 设置 为 types .SimpleNamespace 或 者 argparse. Namespace， 
至 是 另外 一 个 Command 实例 来 配置 这 个 Commana 类 。 这 上 段 代 人 码 会 用 namespace 对 象 中 的 值 
来 填充 实例 变量 。 

一 旦 对 象 配置 完成 ， 我 们 就 可 以 通过 调用 run () 方法 来 设置 它 并 开始 执行 命令 工作 。 这 个 类 
实现 的 是 一 个 相对 简单 的 用 例 。 


main= SomeCommand () 













































































































































































main.config= config 


main.run() 


下 面 是 一 个 实现 了 21 点 模拟 操作 的 具体 子 类 。 























class Simulate Command( Command ): 

dealer rule map = {"Hit17": Hit17, "Standl7": Standl7} 

split rule map = {'ReSplit': ReSplit, 
'NoReSplit': NoReSplit, 'NoReSplitAces': NoReSplitAces]} 

player rule map = {'SomeStrategy': SomeStrategy, 
'AnotherStrategy': AnotherStrategy} 

betting rule map = {"Flat": Flat, 
"Martingale": Martingale, "OneThreeTwoSix": OneThreeTwoSix} 








def run( self ): 
dealer rule= self.dealer rule maplself.dealer rule]() 
split rule= self.split rule maplself.split rule]() 
try: 
payout= ast.literal _ eval( self.payout ) 





assert len(payout) == 2 
except Exception as e: 
raise Exception( "Invalid payout {0}".format (self.payout) ) 


from e 








table= Table( decks=self.decks, limit=self.limit, 


388 第 16 章 使 用 命令 行 


dealer=dealer rule, 

split=split rule, payout=payout ) 

player rule= self.player rule maplself.player rulel] () 

betting rule= self.betting rule mapl[lself.betting rule] () 

player= Player( play=player rule betting=betting rule, 
rounds=self.rounds, stake=self.stake ) 

simulate= Simulate( table, player, self.samples ) 

with open(self.outputfile, "w", newline="") as target: 
wtr= csv.writer( target ) 


wtr.writerows( simulate ) 
这 个 类 实现 了 基本 的 顶层 函数 ,这 个 函数 用 于 配置 不 同 的 对 象 然后 执行 模拟 操作 。 我 们 将 前 面 
介绍 的 simulate _ blackjack() 函数 封装 起 来 创建 了 command 类 的 一 个 具体 的 扩展 类 。 这 可 以 
像 下 面 的 代码 这 样 将 其 用 在 主 脚本 中 。 


if name == " main ": 























































































































with Logging Config(): 

with Application Config() as config: 
main= Simulate Command () 
main.config= config 


main.run() 

















尽管 我 们 可 以 让 这 个 命令 成 为 Callable 并 且 用 main () 人 代替 main.run()， 但 是 ， 这 里 使 
用 可 调用 对 象 可 能 会 引起 混乱 。 我 们 显 式 地 分 离 了 以 下 3 个 设计 问题 。 

@ 构造 : 特意 保留 初始 化 为 空 。 在 后 面 的 部 分 中 ， 我 们 会 向 你 介绍 一 些 PITL 的 例子 ， 在 这 些 例 

子 中 ， 我 们 会 从 一 些 很 小 的 组 件 命令 创建 出 一 个 更 大 的 复合 命令 。 

@ 配置 通过 property 设置 器 将 配置 导入 ， 这 样 就 与 创建 和 控制 的 代码 分 离 了 。 

@ 控制: 在 构造 和 配置 完成 后 ， 这 是 真正 执行 命令 定义 的 操作 部 分 。 

当 我 们 介绍 可 回调 对 象 和 函数 时 ， 构 造 是 定义 的 一 部 分 。 配 置 和 控制 被 合并 为 函数 调用 本 身 的 
一 部 分 。 如 果 我 们 想 要 定义 可 回调 对 象 ， 就 必须 牺牲 一 部 分 灵活 性 。 


16.6.2 ”添加 用 于 分 析 的 命令 子 类 





















































































































































































































































我 们 会 扩展 应 用 程序 ， 添 加 分 析 功 能 。 由 于 我 们 在 使 用 命令 设计 模式 ， 因 此 可 以 为 分 析 功 能 再 
添加 另 一 个 子 类 。 
下 面 是 我 们 的 分 析 功 能 。 
class Analyze Command( Command ) : 
def run( self ): 
with open(self.outputfile, "“"r", newline="") as target: 


rdr= csv.reader( target ) 

outcomes= ( float (row[10]) for row in rdr ) 
first= next (outcomes) 

sum 0, sum 1 = 1, first 


value min = value max = first 
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for value in outcomes: 
sum 0 += 1 # value**0 
Sum 1 += Value # value**1 
Value min= min( value min, value ) 
value max= max( value max, value ) 
mean= sum 1/sum 0 
print( 
"{4}\nMean = {0:.1f}\nHouse Edge = {1:.1%}\nRange = {2:.1f} 
{3i Lf" tOormat 
mean, l-mean/50, value min, value max, self.outputfile) ) 
从 统计 学 的 角度 来 看 ， 这 段 代 码 意 义 不 大 。 但是， 这 里 的 关键 是 向 你 展示 用 第 2 个 使 用 配置 命 















































名 空间 的 命令 完成 和 我 们 的 模拟 相关 的 工作 。 我 们 用 
分 析 的 文件 。 


16.6.3 ”回应 用 程序 中 添加 更 多 的 功能 








了 outputfile 配置 参数 命名 来 执行 一 些 统计 






























































前 面 ， 我 们 介绍 了 一 种 支持 多 个 功能 的 通用 方法 。 一 些 应 用 程序 中 使 用 了 多 个 顶层 的 main 程 
序 ， 它 们 分 别 位 于 独立 的 .py 脚本 文件 中 。 
当 我 们 想 要 合并 不 同文 件 中 的 命令 时 ， 我 们 必须 编写 一 个 用 于 创建 更 高 层次 的 复合 程序 的 shell 


















































脚本 。 再 引入 另 一 个 工具 和 另 一 种 语言 来 做 PITL 看 起 来 不 是 一 个 好 主意 。 

一 个 更 灵活 一 些 的 方法 是 创建 独立 的 脚本 文件 ， 然 后 基于 位 置 参数 来 选择 茶 个 顶层 Command 
对 象 。 在 我 们 的 例子 中 ， 我 们 想 要 选择 模拟 或 者 分 析 命 令 。 为 此 ， 可 以 在 命令 行 参数 中 添加 一 个 参 
数 以 解析 下 面 的 代码 。 


parser.add argument ( 












































"command", 
lyze'] ) 
"outputfile", 


action="store", default='simulate', 


choices=['simulate', ‘'ana 


parser.add argument ( 


这 段 代 码 会 更 改 命令 行 API 并 将 顶层 动词 添加 到 命令 行 中 。 我 们 可 以 很 容易 地 将 参数 映射 到 
对 应 的 类 名 。 


{'simulate': 


action="store", metavar="output" ) 











Simulate Command, ‘analyze': Analyze Command} [options. 


command] 


这 人 允许 我 们 创建 更 高 级 的 复合 功能 。 例如， 我们 可 能 想 要 
中 。 同 时 ， 也 希望 可 以 不 用 shell 就 能 够 实现 这 点 。 


16.6.4 ”设计 更 高 级 的 复合 命令 
下 面 我 们 会 介绍 如 何 基 于 一 些 命令 设计 一 个 复合 命令 。 我 们 用 两 种 设计 策略 : 复合 对 象 和 复合 类 。 
如 果 我 们 使 用 复合 对 象 ， 那 么 复合 命令 就 是 基于 内 置 的 1ist 或 者 tuple。 我 们 可 以 扩展 或 封 
人 


装 某 个 现 有 的 序列 。 我 们 会 创建 复合 的 commanq 对 象 作 为 保存 其 他 command 对 象 的 集合 。 我 们 
可 能 会 考虑 一 些 类 似 下 面 这 样 的 代码 。 








将 模拟 和 分 析 合 3 





到 


个 全 局 的 程序 
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simulate and analyze = [Simulate(), Analyze()] 








这 样 做 的 缺点 是 我 们 还 没有 为 独特 的 复合 命令 创建 新 类 。 我们 创建 了 一 个 通用 的 复合 对 象 ， 并 
实例 填充 它 。 如 果 想 要 创建 更 高 级 的 复合 对 象 ， 就 必须 基于 内 置 的 序列 类 解决 底层 的 Command 
类 和 更 高 层 的 复合 Commang 对 象 间 不 对 称 的 问题 。 

我 们 倾向 于 把 一 个 复合 命令 也 当 作 命令 的 一 个 子 类 。 如 果 使 用 复合 类 ,那么 对 于 底层 命令 和 更 
高 层 的 复合 命令 ， 我 们 会 获得 一 个 更 一 致 的 结构 。 

下 面 是 一 个 实现 了 一 系列 其 他 命令 的 类 。 










































































sr 
























































class Command Sequence (Command): 
sequence = [] 
def init ( self ): 





self. sequence = [ class () for class in self.sequence | 
def set config( self, config ) : 
for step in self. sequence: 
step.config= config 
config= property( fset=set config ) 
def run( self ) : 
for step in self. sequence: 
step.run() 


我 们 定义 了 一 个 类 级 变量 sequence, 它 包含 一 系列 的 命令 类 。 当 对 象 初始 化 时 ， init __() 
用 self.sedquence ! 的 命名 类 对 象 构造 一 个 内 部 的 实例 变量 一 一 _sequence。 
当 配置 完 成 后 ， 它 会 被 推送 给 每 个 复合 对 象 。 当 复合 命令 通过 run0 执 行 时 ， 该 操作 会 被 委托 
给 复合 命令 中 的 每 个 组 件 来 完成 。 
下 面 是 基于 两 个 Command 子 类 创建 的 另 一 个 command 子 类 。 






















































































class Simulate and _ Analyze (Command Sequence): 
sequence = [Simulate Command, Analyze Command] 

















现在 ， 我们 可 以 创建 一 个 包含 一 系列 独立 步 又 的 类 。 由 于 这 是 Commanq 类 的 一 个 子 类 ， 它 包 
含 必要 的 多 态 性 API。 现 在 ， 可 以 用 这 个 类 创建 复合 命令 ， 因 为 它 与 其 他 command 的 子 类 兼容 。 
现在 ， 我 们 对 参数 解析 过 程 做 一 个 很 小 的 修改 就 可 以 将 这 个 功能 添加 到 应 用 程序 中 。 












































parser.add argument ( "command", action="store", default='simulate', 


choices=['simulate', "analyze' 'simulate analyze'] ) 














我 们 简单 地 将 另外 一 个 选择 添加 到 参数 选项 中 ， 还 需要 修改 参数 选项 字符 串 和 类 之 间 的 映射 。 











{'simulate': Simulate Command, ‘analyze': Analyze Command, 'simulate_ 
analyze': Simulate and Analyze} [options.command] 
































请 注意 ,我们 不 应 该 用 类 似 于 both 这 样 模糊 的 名 称 来 合并 两 个 命令 。 如 果 程 序 中 没有 这 种 模 
糊 的 概念 ， 我 们 就 为 扩展 和 修改 应 用 程序 保留 了 可 能 。 用 命令 设计 模式 让 添加 功能 变 得 很 容易 。 我 
们 可 以 定义 复合 命令 或 者 将 一 个 很 大 命令 分 解 为 一 些 更 小 的 命令 。 


















































打包 和 实现 可 能 包括 添加 一 个 选项 ; 
件 (参见 第 13 章 “ 配 置 文件 和 持久 化 ”)， 就 可 以 直接 在 配置 文件 ! 





串 到 类 的 映射 。 





16.7 
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将 该 选项 映射 到 一 个 类 名 。 如 果 我 们 使 用 更 完整 的 配置 文 









































16.7 其 他 的 复合 命令 设计 模式 


现在 ， 我 们 可 以 辨别 一 些 不 同 的 复合 命令 设计 模式 。 在 前 面 的 例子 中 ， 我 们 设计 了 一 系列 的 复 
合 命令 。 我 们 可 以 从 bash shell 的 复合 操作 符 : ;，&， |， 和 组 合 操作 符 : (; ) 中 寻找 灵感 。 除 了 这 




















些 之 外 ， 我 们 可 以 在 shell 中 使 用 








if、for 和 while 循环 。 
我 们 介绍 了 command_Sequence 类 中 的 序列 操作 符 〈; )。 序 列 的 概念 无 处 不 在 ， 所 以 许多 编程 





提供 类 名 并 且 保 存 从 选项 字符 

















语言 《例如 shell 和 Python ) 都 不 需要 显 式 的 操作 符 ， 而 是 简单 地 使 用 行 末 作 为 隐 式 的 序列 操作 符 语 法 。 








shell 的 操作 符 创建 了 两 个 3 


























Concurren 类 ， 这 个 类 使 用 multiprocessing 创建 两 个 子 进程 关 








shell 中 的 | 操作 符 会 创建 一 个 管道 : 






































一 个 命令 的 输出 缓冲 区 是 另外 一 








发 执行 的 命令 。 我 们 可 以 创建 一 个 带 有 run () 方法 的 Commana_ 




















F 且 会 等 待 这 两 个 子 进程 结束 。 
个 命令 的 输入 缓冲 区 ， 同 




















时 ， 命 令 是 并 发 执行 的 。 在 Python 中 ， 我 们 需要 创建 一 个 队列 和 两 个 用 于 读 写 队 列 的 进程 。 这 是 


























个 更 复杂 的 情况 ， 它 包括 用 队列 中 的 对 象 填充 不 同 子 对 象 的 配置 。 第 12 章 “ 传 输 和 共享 对 象 ” 中 有 
些 结合 队列 使 用 multiprocessing 在 


shell 中 的 if 语句 有 许多 不 同 的 用 例 。 












































个 方法 来 提供 有 一 个 原生 的 Python 实现 。 
处 理 过 程 并 不 会 为 我 们 带 来 什么 帮助 。 我 们 可 以 并 且 也 应 该 只 使 用 Python。 




































































以 简单 地 在 Python 的 方法 中 使 / 








class ForAllBets Simulate ( 


def run( self ): 


for bet class in 





发 进程 间 传 递 对 象 的 例子 。 

































































个 现 有 的 命令 应 用 于 集合 : 








Command ) : 


self.betting rule= bet class 
self.outputfile= "p3 c16 simulation7 {0}.dat".format (bet_ 


class) 


sim= Simulate Command () 


sim.config= self 


sim.run() 

















我 们 在 应 用 程序 中 遍历 3 个 用 了 








长 














个 模拟 程序 并 运行 。 














请 注意 ， 这 个 for-all 类 与 前 下 











下 注 的 类 ,对 于 其 中 的 每 个 类 ， 我们 都 修改 了 配置 、 创 建 了 一 











定义 的 Analyze_Command 类 不 














的 所 有 值 。 












































但 是 ， 没有 什么 令 人 信服 的 原因 不 通过 commang 子 类 的 一 
创建 一 个 复杂 的 Commanq 类 模仿 Python 的 if-elif-else 


类 似 地 ，shell 中 的 while 和 for 命令 也 不 需要 我 们 在 更 高 级 的 command 类 中 定义 。 我 们 可 
它们 。 


下 面 是 一 个 for-all 的 类 定义 ， 它 将 





"Flat", "Martingale", "OneThreeTwoSix": 






































容 。 我 


门 不 能 只 是 简单 地 创 








建 能 够 反映 不 同业 务 领域 的 复合 对 象 。Analyze_Command 类 运行 一 个 单独 的 模拟 程序 ， 但 是 





























ForAllBets_Simulate 运行 一 系列 的 模拟 程序 。 我 们 有 两 种 方法 可 以 创建 互相 兼容 的 业务 领域 : 可 
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以 创建 一 个 Analyze_All 命令 或 者 ForAl11 


户 的 需求 。 





Bets Sim and Analyze fl 


16.8 与 其 他 应 用 程序 集成 


| 





使 用 Python 与 其 他 应 | 














| 程 




















因为 应 | 
@ 








程序 太 多 了 , 而 且 每 个 
Python 可 能 会 作为 应 用 





应 用 程序 都 
程序 的 朋 




















他 
双人 省 








全 人 


























方 令 。 和 他 


序 集成 时 ， 有 一 些 方法 我 们 可 以 使 用 。 很 难 提供 一 个 全 























自己 独特 的 功能 ,我 们 可 以 介绍 一 些 通 














nd 














] 哪 种 设计 取决 于 用 


| 的 设 i 





面 的 概述 ， 


十 模式 。 





本 语言 。 对 大 多 数 例子 而 言 ， 下 面 列表 中 的 应 用 








程序 简单 地 





把 Python 作为 添加 功能 的 主要 方法 : https://wiki.python.org/moin/ AppsWithPythonScripting。 


多 
Python 。 
可 


C++ 





NS 





一 个 Python 模块 可 以 实现 应 | 
绑 定 的 Python 模块 。 


以 用 ctypes 模块 直接 用 
和 写 的 时 候 ， 这 种 方式 工 











可 » 
个 
可 
的 标 ? 


























APl， 


台 已 
能 会 


以 用 STDIN 和 STDOUT 
应 用 程序 ! 


信 输 


也 可 以 月 





| 
提供 Python 应 
更 好 。 由 了 


这 个 级 别 的 灵活 性 意味 着 我 人 
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程序 的 API。 有 许多 应 ) 
个 语言 的 应 用 程序 的 开发 者 通常 会 


创建 shell 级 别 和 


















































gr 


。 当 创建 与 shell 兼容 的 应 上 
以 用 supprocess 模块 访问 应 用 程 
































程序 包含 用 了 











为 其 他 的 语言 提供 API 


提供 应 用 程序 API 
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十 ， 


包括 














的 管道 ， 这 个 管道 将 我 们 
程序 时 ,我 们 可 能 也 会 考虑 使 用 fileinput 模块 。 


Python 实现 另外 一 个 程序 的 API。 当 应 用 程序 库 是 用 
乍 可 以 很 好 地 工作 。 











C 或 者 





的 应 用 

















输出 接口 





来 与 





蕊 正确 交互 。 














C 或 C++ 编 


























写 自 己 的 与 Python 兼容 的 模块 。 在 本 例 | 


序 的 命令 行 接口 。 这 可 能 还 


























我 们 





SS 





























程序 连接 到 另外 一 











包括 需要 连接 到 应 | 



































可 以 使 


























要 编 























大 的 复合 应 用 程 
程序 ， 























定义 的 类 入 
还 有 一 些 其 他 的 设计 要 素 我 们 会 保留 到 


亨 的 粘 合剂 。 当 将 Python 





I 对 象 镜像 定义 。 









































作为 集成 
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第 17 章 “ 模 块 



































架构 设计 要 素 ， 已 经 超出 了 使 用 命令 行 的 范畴 。 
士 
16. 9 总 结 
我 们 介绍 了 如 何 使 用 argparse 和 os .environ 来 获取 命令 行 参 数 和 配置 参数 。 这 是 基于 第 





13 章 “ 配 置 文 






































牛 和 持久 化 ”中 介绍 的 技术 创建 的 。 





和 包 的 设计 ”， 


的 工具 来 完成 。 














门 通常 使 用 Python 作为 集成 框架 或 者 作为 将 小 应 | 
EE 架 使 用 时 ， 我 们 通常 会 包含 在 另外 

















介绍 。 这 些 都 是 高 级 


的 类 或 函数 。 比 起 使 用 ctypes 的 API， 这 样 做 的 ; 


译 C 或 Cr++， 它 需要 更 多 





序 





j 程 





jC 实现 外 部 应 用 程序 的 








LA 和 
生 能 吕 

















程序 
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个 应 用 















































































































































目标 是 显 





我 们 可 以 用 argparse 实现 许多 通用 的 命令 行 功能 。 这 包含 通用 功能 ， 例 如 显示 版 本 号 并 退 
出 或 者 显示 帮助 文本 并 退出 。 

我 们 介绍 了 用 命令 设计 模式 创建 可 以 通过 扩展 或 重 构 来 添加 功能 的 应 用 程序 。 我 们 的 
式 地 保持 顶层 的 主 函 数 体 尽 可 能 地 精简 。 





16.9.1 


命令 行 API 是 最 终 应 | 


设计 要 素 和 折 中 方案 


程序 的 重要 组 成 部 分 。 尽管 我 们 大 多 数 的 精力 都 花 在 设计 应 
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程序 在 

























































































运行 时 的 行为 ， 但 是 我 们 需要 注意 两 个 临界 状态 : 启动 和 关闭 。 当 我 们 启动 应 用 程序 时 ， 它 必须 易 
于 配置 。 同 样 地 ， 它 必须 优雅 地 关闭 ， 正 确 地 刷新 所 有 输出 缓冲 区 并 且 释 放 所 有 的 操作 系统 资源 。 
当 编写 公开 的 API 时 , 我 们 必须 处 理 模式 演化 问题 的 一 个 变种 。 由 于 我 们 的 应 用 程序 一 直 在 演 
且 关 于 用 户 的 信息 也 在 演变 ， 这 时 致 我 们 会 修改 命令 行 API。 这 可 能 意味 着 我 们 会 有 一 些 旧 功 
能 或 者 旧 语 法 。 它 可 能 也 意味 着 我 们 必须 破坏 与 昌 命 令 行 设计 的 兼容 性 。 


在 许多 情况 下 ， 我 们 会 需要 确保 主 版 本 号 是 


























们 应 ) 








模块 命名 为 someapp， 而 应 该 考虑 以 someappl 开头 ， 














分 。 不 应 该 通过 添加 版 本 号 作为 新 后 级 的 方式 修改 命令 生 








这 样 版 本 号 总 是 作为 应 




















到 someapp2 开始 的 可 能 。 


16.9.2 

















ce 
| 














的 应 用 程序 中 。 


字 可 能 是 一 个 包 。 它 可 能 还 包括 一 些 其 他 的 应 | 


展望 
在 下 一 章 中 ， 我 们 会 扩展 一 些 顶 层 的 设计 要 素 ; 
程序 可 以 作为 一 个 模块 ， 它 可 以 被 导入 到 一 个 更 大 的 应 用 程序 ! 



































「 APT， 











程序 名 称 的 一 部 分 。 


我 们 不 应 该 将 顶层 的 





















































程序 名 称 的 一 部 











对 尖 以 someappl 开始 保留 了 转变 


介绍 模块 和 包 的 设计 。 一 个 小 型 的 Python 
。 一 个 复杂 的 Python 应 用 程 
程序 模块 ， 同 时 ， 它 也 可 以 被 包含 到 一 些 更 大 规模 
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模块 和 包 的 设计 























Python 为 我 们 提供 了 一 些 高 层面 上 的 结构 来 组 织 软 件 。 在 第 1 部 分 “用 特殊 方法 实现 Python 
风格 的 类 ”中 ， 我 们 介绍 了 一 些 如 何 使 用 类 定义 正确 地 将 结构 和 行为 进行 绑 定 的 技巧 。 在 本 章 中 ,将 



































介绍 如 何 使 用 模块 对 类 、 
来 对 相关 模块 进行 组 织 。 



































在 Python 中 ,创建 简单 的 模块 很 容易 。 任 何 时 候 ， 我 们 在 创建 一 个 Python 文件 的 同时 就 
创建 了 一 个 模块 。 随 着 设计 范围 的 扩大 以 及 复杂 度 的 增加 ， 需 要 使 用 包 对 模块 进行 组 织 ， 从 而 使 维 












































护 更 清晰 ， 这 点 很 重要 。 








函数 和 全 局 对 象 进行 封装 。 关 于 模块 的 组 





























织 ， 会 使 用 包 作 为 一 种 设计 方案 


2 冯 


























我 们 也 会 有 一 些 特殊 模块 。 对 于 大 的 应 用 来 说 ， 我 们 会 实现 一 个 _main 模块 。 这 个 模块 用 于 给 
































应 用 提供 OS 命令 行 接口 。 它 的 设计 不 能 阻碍 应 用 中 简单 的 重用 ， 这 样 才能 创建 更 大 、 更 复杂 的 应 用 。 







































































在 选择 如 何 安 装 模 块 上 也 有 一 些 灵活 性 。 可 以 使 用 默认 的 安装 目录 、 环 境 变 量 的 设置 、.ptnh 
文件 以 及 Python 的 1ib/site-packages 目录 ， 它 们 都 各 有 优 缺 点 。 
























































目的 源 代 码 分 支 。 有 些 不 适用 了 







































































17.1 设计 一 个 模块 






































模块 是 Python 中 实现 和 重用 的 单元 。 所 有 的 Python 编程 都 是 在 模块 层面 提供 的 。 类 是 画 











在 分 发 Python 代码 时 ， 我 们 要 避免 复杂 的 问题 。 有 很 多 技术 可 以 
苗 向 对 象 设计 。 在 Python 标准 库 的 第 30 















































于 创建 一 个 Python 项 
章 中 ， 解 决 了 一 些 物理 文 





























牛 包 的 问题 ， 在 分 发 Python 模块 的 文档 中 ， 在 创建 代码 分 支 上 提供 了 一 些 信息 。 



































向 对 象 设 计 和 编程 的 基础 。 模 块 














更 高 层 





类 的 集合 一 一 是 在 Python : 























面 上 的 可 重用 单元 。 

















一 个 Python 模块 是 一 个 文件 ,文件 扩展 名 必须 为 .py。 在 .py 之 前 的 文件 名 必须 为 一 个 有 效 
的 Python 名 。 在 Python 语言 参考 的 第 2.3 节 中 ， 为 我 们 提供 了 命名 的 完整 定义 。 其 中 的 一 点 是 : 



































下 划 线 ， 以 及 不 能 作为 标识 符 开始 的 数字 〈0 一 9 )。 



































文件 名 (不 包括 .py)〉 将 作为 模块 名 称 。 























在 ASCI 范围 《U+0001..U+007F) 内 ， 标 识 符 的 有 效 字符 与 Python 2.x 相同 : 大 小 写字 母 (A 一 Z)、 








在 OS 文件 中 允许 使 用 比 在 Python 名 称 中 更 多 ASCII 范围 内 字符 , 这 一 点 复杂 度 可 以 被 忽略 。 
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每 次 创建 一 个 .py 文件 ,就 创建 了 一 个 模块 。 通常 , 创建 一 个 Python 文件 时 不 需 






































设计 。 为 了 创建 可 重用 的 模块 ， 在 本 章 中 ， 会 介绍 一 些 设计 上 的 考虑 因素 。 




















出 于 私有 的 目的 ，Python 也 会 创建 .pyc 和 .pyo 文件 ; 忽略 它 
们 就 可 以 了 。 有 些 程序 员 试 图 去 使 用 .pyc 文件 作为 一 种 已 编译 的 
» 对 象 代码 来 蔡 代 .py 文件 ， 以 达到 对 源 代码 保密 的 目的 ， 以 至 于 
Q 浪费 了 很 多 脑 细胞 。 我们 需要 强调 一 点 ，.Pyc 文件 可 以 很 容易 
地 被 反 编译 ， 无 法 达到 任何 保密 的 目的 。 如 果 需 要 阻止 对 应 用 的 
任何 逆向 工程 ， 可 能 需要 考虑 换 一 种 语言 。 


17.1.1 一 些 模块 设计 的 方法 
有 关 Python 模块 的 设计 ， 有 3 种 常见 的 设计 方案 。 

















要 做 太 多 的 


@ 。 库 模 块 : 它们 意味 着 要 被 导入 的 部 分 ， 包 括 类 、 函 数 以 及 一 些 创 建 全 局 变量 的 赋值 语句 。 它 们 













































































不 包括 任何 实际 的 工作 ， 因 此 不 必 担 心 在 导入 时 会 产生 副作用 的 问题 。 我 们 会 介绍 两 种 用 例 。 
4 全 局 模块 : 一 些 模块 的 设计 将 被 导入 作用 于 全 局 范围 ， 创 建 一 个 模块 命名 空间 ， 包 含 
了 所 有 项 的 集合 。 

















4 项 集合 : 一 些 模块 被 设计 为 包含 一 些 独 立项 的 导入 ， 而 不 是 创建 一 个 模块 对 象 。 














@ 主要 脚本 模块 : 它们 意味 着 从 命令 行 执行 。 它 们 包含 的 不 仅 是 类 和 函数 定义 ， 还 包括 做 实 

















际 工作 的 语句 ， 可 能 会 产生 副作用 。 由 于 副作用 的 存在 ， 它 们 不 能 做 导入 。 如 果 试 图 导 




















一 个 主要 脚本 模块 ， 它 将 被 执行 一 一 做 实际 的 工作 ， 可 能 会 更 新 文件 或 在 运行 时 做 模块 被 





设计 要 做 的 事情 。 















































@ 条 件 脚本 模块 : 这 些 模块 有 两 个 用 例 : 它们 可 以 被 导入 并 且 也 可 以 从 命令 行 执行 。 这 些 
模块 将 包含 主要 导入 的 开关 , 正如 在 Python 标准 库 中 28.4 节 中 所 介绍 的 _main 一 一 最 
























































高 级 别 的 脚本 环境 。 
以 下 是 基于 库 文档 被 简化 后 的 条 件 脚本 。 


Tf name == " main " 























main() 



































main() 函数 做 了 脚本 的 工作 。 这 个 设计 支持 两 种 情况 : run 和 import。 当 模块 从 命令 行 i 
行 时 ， 它 执行 了 main () 并 且 做 了 所 期 望 的 工作 。 当 模块 被 导入 时 ， 函 数 不 会 被 执行 ， 模 块 只 是 用 














于 提供 定义 ， 而 没有 做 实际 的 工作 。 
建议 使 用 更 复杂 的 方式 ， 如 第 16 章 “ 使 用 命令 行 ”中 所 介绍 的 。 






































后 下 name == " main ": 





with Logging Config(): 
with Application Config() as config: 


main= Simulate Command () 
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main.config= config 


main.run() 





这 样 做 的 目的 是 反映 











对 于 导入 来 说 ， 创 建 一 些 模块 级 另 
打印 输出 、 更 新 文件 以 及 其 他 的 副作用 


没有 使 用 





























8 以 下 这 个 设计 的 基本 要 素 。 





导入 模块 时 ， 应 该 只 有 很 少 的 副作用 。 ] 





I 的 变量 是 可 以 接受 的 副作用 。 而 实际 工作 一 一 访问 网 络 资源 、 











name ==" main "的 



































在 导入 模块 时 不 应 该 发 生 。 
主要 脚本 模块 通常 是 糟糕 的 ， 因 为 它 不 会 被 导入 或 重用 。 







































































更 糟 的 是 ， 文档 工具 很 难 与 主要 脚本 模块 一 起 工作 ， 而 且 很 难 测试 。 如 果 使 用 文档 工具 导入 模块 ， 就 








会 导 

















好 致 一 些 不 可 预见 的 事情 发 生 。 类 似 地 ， 





17.1.2 ”模块 和 类 


在 定义 模块 和 类 时 ， 会 涉及 以 下 几 点 。 


@ ”模块 和 类 在 Python 中 都 有 一 个 名 称 。 模 块 通常 使 用 以 小 写字 母 开 头 的 名 称 ， 类 通常 使 用 
以 大 写字 母 开 头 的 名 称 。 
的 定义 都 是 包含 了 对 象 的 命名 空间 。 


局 命名 空间 sys .modules 中 是 单 例 的 对 象 。 类 定义 在 命名 空间 中 是 唯一 的 ， 要 


@ ”模块 和 类 
@ ”模块 在 全 


















































在 测试 时 要 避免 将 导入 模块 作为 测试 的 一 个 步骤 。 
























































么 在 全 局 命名 空间 _main 中 或 是 一 些 本 地 的 命名 空间 。 类 不 是 单 例 ， 定 义 可 以 被 替换 。 


一 旦 完成 了 导入 ， 模 块 不 能 

















次 被 导入 ， 除 非 被 删除 。 








@ 在 命名 空间 中 ， 类 或 模块 的 定义 可 











@ 模块， 








函数 的 定义 等 价 于 类 定义 中 





@ 模块， 


类 的 定义 等 价 于 另 一 个 类 中 








在 模块 和 类 之 间 有 两 点 明显 的 区 昂 





I 


o 














@ 不 能 创建 模块 的 实例 ， 它 总 是 单 例 


@ 在 模块 的 赋值 语句 中 将 创建 在 模块 命名 空间 内 的 全 局 变量 , 它 可 以 在 整个 模块 中 被 使 用 。 

















以 被 作为 语句 序列 来 执行 。 
的 静态 方法 。 
的 类 定义 。 




















的 ， 但 可 以 创建 类 的 多 个 实例 。 
































定义 


| 总 
模块 和 类 很 相似 ， 在 它们 之 间 做 选择 


instance of 是 六 


会 被 定义 一 次 ， 








的 赋值 语句 将 在 类 命名 空间 中 创建 一 个 变量 ， 它 需要 一 个 限定 词 来 区 分 全 局 变量 。 








模块 与 类 相似 。 模 块 、 























并 



































包 和 类 都 可 用 于 封装 数据 并 将 属性 和 一 些 ] 


操作 进行 处 理 ， 被 存 入 对 象 中 。 














会 需要 在 设计 上 做 一 些 决策 和 权衡 。 在 大 多 数 情 况 下 ， 
R 定 的 因素 。 模 块 的 单 例 功能 意味 着 使 用 的 模块 (或 包 ) 中 所 包含 的 类 和 函数 只 






































即使 导入 多 次 也 是 一 样 的 结果 。 
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然而 ， 有 些 模块 具备 类 的 风格 。 例 如 ，logging 模块 ， 通 常 在 其 他 模块 中 被 导入 。 单 例 功能 



























































意味 着 日 志 配 置 只 需 





但 它 
































要 设置 一 次 ， 会 应 用 到 所 有 的 模块 中 。 















































类 似 的 , 对 于 配 









































置 模块 , 也 会 在 多 个 地 方 被 导入 。 壕 寺 单 例 意味 着 配置 可 被 导入 到 任意 模块 ! 




















访问 


门 是 全 局 的 。 






































民 可 以 通过 应 用 





但 编写 的 程序 使 用 


















































的 是 单一 连接 的 数据 库 ， 包 含 多 个 函数 的 模块 与 单 例 的 类 是 类 似 的 。 数 据 库 
进行 导入 ， 但 它 将 成 为 一 个 单 例 的 、 全 局 的 共享 对 象 。 


























17.1.3 ”模块 中 应 该 包含 的 内 容 


Python 模块 中 有 一 个 典型 的 组 织 结 构 。 关 于 这 一 点 ， 在 PEP8 中 有 一 些 定 义 ， 可 以 参见 
http://www.python.org/dev/peps/pep-0008/。 


模块 的 第 1 行 可 以 是 以 # 为 开头 的 注释 ， 用 于 标注 版 本 号 ， 如 下 所 示 。 
#!/usr/bin/env python3.3 


这 样 会 有 助 于 OS 的 工具 进行 相关 操作 ， 例 如 以 bash 为 可 执行 的 脚本 文件 来 查找 Python 解 





释 器 。 

























































































在 Windows 











更 早 的 Python 


# -*— coding: 


编码 格式 注释 在 

















， 这 行 代码 将 为 #!1C:\Python3\python .exe。 
模块 会 包含 一 行 注 释 来 标识 文本 的 编码 格式 ， 如 下 所 示 。 
Do Ss 


Python3 中 不 是 必需 的 ，OS 的 编码 信息 已 经 足够 了 。 早 期 的 Python 实现 会 假设 






































文件 都 是 以 ASCII 编码 的 ， 对 于 没有 使 用 ASCII 编码 的 文件 ， 就 需要 使 用 编码 格式 注释 来 进行 说 明 。 


模块 中 接 下 来 的 几 行 应 该 为 3 层 引 号 的 模块 文档 字符 串 ， 
Python 中 其 他 文档 
及 使 用 作 完 整 的 定义 和 说 明 。 可 以 包含 RST 标记 语言 ， 这 样 就 可 以 使 用 文档 工具 基于 文档 字符 串 
































j 于 定义 模块 文件 中 的 内 容 。 和 
字符 串 一 样 ， 在 文本 的 第 1 段 要 进行 总 结 说 明 。 接 下 来 要 对 模块 内 容 、 目 的 以 








pe 































































































生成 优雅 的 输出 。 我 们 会 在 第 18 章 “ 质 量 和 文档 ”对 这 一 点 进行 说 明 。 
在 写 完 文档 字符 串 之 后 ， 就 可 以 添加 版 本 信息 了 ， 如 下 所 示 。 


了、 


之 且 。 





























_ version = 


"2.7.18" 




















沁 是 为了 确定 企稳 序 的 部 他 位 时 及 引 用 的 皮 本 导 “ 束 全 的 定义 是 伍 训 全 二 从 有 这 局 % 借 溢 从 








然后 是 模块 的 























import 语句 。 一 般 地 ， 它 们 出 现在 模块 的 前 面 。 

















在 import 语 





在 名 之后， 接 下 来 是 模块 中 类 和 函数 中 变量 的 定义 。 它 们 没有 固定 的 顺序 ， 但 要 确 



































保 程序 能 够 正确 地 运行 并 要 考虑 到 代码 的 可 读 性 。 














[a 


Java 和 C++ 倾向 于 每 个 文件 定义 一 个 类 。 这 样 的 限制 不 够 明智 。 
它 不 适用 于 Python， 也 更 不 是 一 种 法 则 。 











如 果 文 件 包含 了 多 个 类 , 那么 可 能 会 认为 这 个 模块 有 点 不 好 维护 。 如 果 发 现 自 己 使 用 了 很 大 的 




















注释 块 来 将 模块 分 成 几 个 部 分 , 这 意味 着 这 个 模块 的 复杂 度 已 经 超出 了 它 的 范围 。 当 有 多 个 模块 时 ， 







































































To 
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可 以 使 用 包 来 管理 。 

在 一 些 模块 中 另 一 种 常见 的 功能 是 在 模块 命名 空间 内 创建 对 象 。 使 用 有 状态 的 模块 变量 〈 例 如 
类 级 别 的 属性 ) 就 不 是 一 个 好 想法 。 缺 乏 对 这 些 变 量 的 可 见 度 会 造成 困惑 


有 了 时， 使 用 全 局 模块 很 方便 。 在 logging 模块 中 大 昌 








模块 创建 Random 














类 默认 实例 上 














时 地 使 用 了 这 一 点 。 另 一 个 例子 是 random 
的 方式 。 这 使 得 很 多 模块 级 别 的 函数 能 够 为 随机 数 提 供 简单 的 API。 

















我 们 不 必 去 创建 random.Randonm 的 实例 。 


17.2 全 局 模块 和 模块 项 


在 库 模 块 内 容 的 选择 上 ， 有 两 
集合 。 当 将 模块 定义 为 一 个 整体 时 ， 



















































































方式 。 一 些 模块 被 集成 为 了 一 个 整体 ,一些 则 
通常 会 包含 一 些 类 或 函数 作为 模块 中 面向 公 


为 互 不 相关 项 的 
的 API。 当 将 模 


































































































块 定 义 为 解 耦 的 项 的 集合 时 ， 每 个 类 或 函数 都 是 独立 的 。 

通常 在 导入 和 使 用 模块 的 方式 上 会 有 所 区 别 ， 以 下 为 3 个 不 同 的 方式 。 

@ 使 用 import some module 命令 。 

some_mogdule .py 模块 文件 将 被 执行 并 且 结果 对 象 被 放 在 了 名 为 some_module 的 命名 空间 中 。 
在 使 用 模块 中 对 象 时 ， 就 需要 使 用 限定 名 称 ， 例 如 some _ module .this 和 some module.that。 这 
种 命名 方式 使 得 模块 看 起 来 是 一 个 整体 。 

@ 使 用 from some module import this 命令 。 

some moqule.py 模块 文件 将 被 执行 并 且 只 有 命名 的 对 象 被 创建 在 了 当前 的 本 地 命名 空间 








。 通 常 ， 这 是 全 














使 用 








from math import sqrt, sin , cos fi 


局 的 命名 空间 。 现 在 可 以 使 月 
块 看 起 来 像 是 一 个 没有 关联 的 对 象 集合 。 




















4 是 





日 this 或 上 that 而 无 需 限 定名 称 。 这 利 





方式 使 得 模 


可 





分 -人 
证 令 。 











这 种 方式 会 为 我 们 提供 一 些 数学 函数 而 无 需 限 定名 称 。 























使 


它 的 默认 行为 是 对 命令 空间 中 的 非 私 有 名 称 进行 
导入 的 名 称 ， 通 过 提供 “al11 列表 来 完成 。 
1 import * 语句 阐述 的 。 
变量 来 对 - 





要 











块 























可 以 使 用 


ij from Some _m 


all 




















odule import * 


全 -人 
命令 。 





[= 


we 


入 。 私 有 名 称 以 _ 起 始 。 可 以 显 式 地 限制 模 


它 是 一 个 字符 串 对 象 名 称 的 列表 ， 这 些 名 称 是 









































[有 具 函数 进行 隐藏 。 它 们 是 创建 模块 的 一 部 分 ， 但 并 不 是 要 暴露 给 





客户 端 API 的 一 部 
































再 次 回顾 21 点 游戏 中 


、 
Is 


瑟 

















下 有 牌 的 设计 ， 在 默认 情况 下 ， 可 以 不 必 





已 


-二 


入 花色 的 实现 细节 。 假 设 我 





们 有 一 个 cards .py 模块 ， 如 以 下 代码 所 示 。 
_all = ["Deck", "Shoe"] 
Glass Surts 
ef 二 Ge 
suits = [ Suit("®"), Suit ("4")，Suit ("y")，Suit ("4") ] 


class Card: 
etc. 
def cardl( 


etlc. 


rank, suit ): 


class 
etc. 

Shoe ( 

etc. 


class Deck ): 








Suit 和 card 类 的 定义 被 保存 在 了 _ all 变量 中 。 
变量 默认 将 不 被 导入 。 例 如 ， 当 执行 以 下 代码 时 。 


Na 








from cards import * 
这 条 语句 将 只 在 应 用 脚本 
当 执行 以 下 命令 时 ， 
import cards 

尽管 没有 导入 到 命名 空间 


以 上 每 种 技术 都 各 有 优 劣 。 
是 明确 的 。 从 模块 ! 



































它 会 导入 模块 ， 但 不 会 向 全 























个 全 局 模块 需要 使 ) 
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而 实现 的 细节 ，card () 函数 和 suits 








创建 Deck 和 Shoe， 与 那些 在 _al11 变量 中 显 式 指定 的 名 称 相 一 致 。 
局 命名 空间 中 添加 任何 名 称 。 











， 我 们 仍 可 以 通过 访问 cards .card () 方法 来 创建 Card 类 。 


j 模 块 名 称 进 行 限定 ， 这 使 得 对 象 的 源 位 置 
导入 项 会 缩短 它们 的 名 称 ， 简 化 了 编程 的 复杂 度 并 : 








省 强 了 可 读 性 。 
















































































设计 包 的 一 个 重要 原则 是 不 要 设计 。 在 Zen of Python 中 这 样 提 到 ; 

“平坦 好 过 联 套 。” 

在 Python 标准 库 中 也 可 以 看 到 这 一 点 。 库 的 结构 相对 平坦 ， 只 有 少数 拒 套 的 模块 。 深 度 稀 套 
的 包 可 能 被 过 度 使 用 了 。 我 们 要 对 过 分 柑 套 保持 怀疑 。 

个 包 由 一 个 目录 和 一 个 “init .py 文件 组 成 。 目 录 名 称 必须 为 适当 的 Python 名 称 ，OS 
的 名 称 中 包含 了 很 多 在 Python 的 命名 中 不 允许 使 用 的 字符 。 





























也 


通常 使 用 以 下 3 种 方式 来 进行 包 的 设计 。 
e@ 























模块 名 称 的 限定 词 ， 例 如 以 下 代码 。 


Import package.module 


一 个 模块 ， 























分 。 可 以 使 用 以 下 代码 进行 导入 。 


import package 








对 于 简单 的 包 ， 使 用 一 个 目录 和 一 个 空 的 _init 





.py 文件 。 这 个 包 的 名 称 将 被 作为 内 部 





的 包 可 以 包含 一 个 _init__.py 文件 作为 模块 的 定义 ， 可 以 从 包 目 录 中 导入 
其 他 模块 。 或 者 ， 它 可 以 作为 包含 了 最 上 层 模块 和 被 限定 的 子 模块 的 大 规模 设计 中 的 一 部 
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import package 








第 1 种 方式 相对 简 册 
看 ， 接 下 来 会 具体 介绍 。 





更 多 方 














目录 是 _init _.py 文件 ! 








可 替代 的 一 种 实现 方式 ， 可 使 用 如 下 代码 。 



































旦 添加 了 _init__ .py 文件， 就 完成 了 包 的 创建 。 其 他 两 种 方式 涉及 














o 


17.3.1 包 与 模块 的 混合 设计 


在 一 些 情况 中 , 设计 演化 成 相当 
需要 将 这 个 复杂 的 模块 重 构 为 一 个 包含 了 多 个 小 模块 的 包 。 





这 样 一 来 ， 包 的 结构 就 像 以 下 





_ init .py 文件 。 
































的 文件 是 一 个 糟 粹 的 主意 。 可 能 











复杂 的 模块 一 一 这 时 使 用 单 

















的 








代码 所 示 这 样 简单 。 以 下 是 命名 为 blackjack 包 目 录 : 


"""Blackjack package""" 


from blackjack 


from bl 
from bl 
且 生 七 于 27 
from bl 


from betting import Flat, 


以 上 代码 演示 了 如 何 创建 一 个 模块 风格 的 包 , 它 实际 上 是 一 个 组 件 ， 
中 导入 的 。 然 后 在 全 局 应 用 




















ackjack 
ackjack 
stand17 
ackjack 





.Casino import ReSplit, 


.cards import Shoe 
.Player import Strategy 1, Strategy 2 


NoReSplit, NoReSplitAces, 


.Simulator import Table, Player, Simulate 


Martingale, OneThreeTwoSix 











他 子 模块 





























可 以 执行 以 下 代码 。 





from blackjack import * 


table= 


decks=6, 





stake=1 


simulate= Simulate 人 


Table 人 


limit=500, dealer=Hit17(), 


split=NoReSplitAces(), payout=(3,2) ) 
player= Player( play=Strategy 1(), betting=Martingale(), rounds=100, 


00 ) 


table, 


player, 100 ) 


for result in simulate: 


print( result ) 


以 上 代码 演示 了 我 们 如 何 使 用 
局 的 blackjack 包 ， 包 含 了 以 下 模块 。 

在 blackjack.cards 包 中 包含 了 Card、Deck 和 
在 blackjack.player 包 中 包含 了 打牌 的 多 种 策 
在 blackjack.casino 包 中 包含 了 用 于 自 定义 牌 

















有 一 个 全 














这 个 





在 betting 包 中 ， 
但 是 对 于 每 个 游戏 都 
包 的 架构 或 许可 以 简单 





在 blackjack.simulator 包 ! 





而 














from blackjack import * 来 定义 源 于 其 他 包 的 一 些 类 ， 


Shoe 的 定义 。 
略 。 

场 规则 的 一 
包含 了 最 上 层 的 模拟 工具 。 







































































的 ， 








| 需要 的 不 同 玩 牌 策略 ， 它 们 对 于 21 点 游戏 不 是 只 





也 包含 了 应 | 


























Jo 


也 优化 我 们 的 设计 。 如 果 每 个 模块 都 简单 一 些 或 者 更 内 聚 ， 它 的 可 





















































读 性 会 更 强 } 




















且 更 容易 到 








E 解 。 





将 每 个 模块 隔离 ， 升 级 起 来 更 容易 。 


17.3.2 使 用 多 种 实现 进行 包 的 设计 
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在 一 些 情况 中 , 会 包含 一 个 最 上 层 的 _init _.py 文件， 需要 在 包 目录 








De 





定 可 以 基于 平台 、CPU 架构 或 者 OS 库 的 可 用 性 。 











关于 包 设计 的 不 同 实现 ， 以 下 














有 两 种 常用 和 一 种 不 太 常见 的 设计 方式 。 


















































不 同 的 实现 中 做 选择 。 








@ 检查 platform 或 sys 来 决定 实现 的 细节 以 及 使 用 if 语句 来 决定 要 导入 的 内 容 。 
try 语句 块 来 捕捉 异常 ， 在 异常 中 对 不 同 配 置 的 情形 做 判断 。 

















@ 试图 使 用 import 并 使 用 



































@ 这 种 方式 不 太 常 见 ， 应 ) 

































































在 导入 应 用 配置 和 基于 配置 导入 其 
的 复杂 度 ， 导 入 会 容易 很 多 。 


















































j 可 通过 检查 配置 参数 来 决定 要 导入 的 内 容 。 这 种 方式 有 些 复杂 。 
也 应 用 模块 之 间 会 存在 先后 顺序 的 问题 。 抛 开 先 后 顺序 














以 下 是 some_algorithm 包 的 _init .py， 它 的 实现 基于 平台 信息 。 


import platform 


bits, linkage = platform.architecture!() 


if bits == '64bit"': 


from some algorithm.long version import * 


else: 


from some algorithm.short version import * 


它 使 用 了 platform 模块 来 获取 平台 的 架构 信息 。 这 里 存在 一 个 顺序 依赖 ， 但 对 标准 库 模 块 
的 依赖 好 过 对 复杂 的 应 用 配置 模块 依赖 。 
































我 们 将 在 some_algorithm 















































包 中 提供 两 个 模块 ，Long_version 模块 
































现 ，short_version 模块 提供 了 另外 一 种 实现 。 设 计 必 须 具 有 模块 同 构 性 ， 




















似 的 。 两 种 模块 都 要 包含 具有 相同 























如 果 两 个 模块 的 文件 中 都 定义 了 名 为 Someclass 的 类 ， 就 可 以 在 应 用 


Import some algorithm 





的 名 称 的 API 的 类 和 函数 。 














提供 了 一 种 64 位 的 实 
这 和 类 的 同 构 性 是 类 














pr 





process= some algorithm.SomeClass () 


我 们 就 可 以 像 导 入 模块 一 样 导 
所 需 类 和 函数 的 定义 。 





























= 














时 ， 这 利 
文件 





入 some_algoritm 包 。 包 会 查找 一 种 上 
























































人 
于 
过 





使 用 如 下 代码 。 




















L 较 合适 的 实现 并 提供 

















用 于 蔡 代 if 语句 的 另 一 种 方式 是 使 用 try 语句 来 查找 可 用 的 实现 方式 。 当 有 不 同 的 分 支 
技术 可 以 很 好 地 工作 。 而 往往 一 个 具有 平台 特殊 性 的 分 支 会 包含 











一 些 在 平台 内 唯一 的 














在 第 14 章 “Logging 和 Warning 模块 ”中 ,在 为 配置 文件 错误 事件 提供 预警 的 上 下 文中 ， 我 们 












































演示 了 这 种 设计 方式 。 对 于 一 些 情 
种 设计 的 功能 。 









































忆 为 不 同 的 配置 是 一 












































这 里 是 一 个 some_algorithm 包 的 _init .py， 基 于 包 中 模块 文 从 


现 方式 。 


F 的 可 用 性 选择 一 种 实 
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EN 


from some algorithm.LIong version import * 





except IlImportError as e: 


from some algorithm.short version import * 


它 依赖 于 两 个 不 同 的 分 支 ， 要 么 包含 some_algorithm/long_version.py 文件 ， 要 么 包含 








some algorithm/short version.py 文件 。 


模块 ， 那 么 short version 将 被 导入 。 



































如 果 没 有 找到 some algorithm.long version 








它 并 不 能 被 扩展 成 支持 超过 两 种 或 3 种 不 同 的 实现 。 随 着 选择 数量 的 增加 ，except 语句 块 将 








产生 深度 的 典 套 。 只 能 将 每 个 try 包裹 在 if 

















来 创建 平坦 式 设计 。 


17.4 ” 主 脚 本 和 main_ 模块 的 设计 




















最 上 层 的 主 脚 本 会 完成 应 用 程序 的 执行 。 在 一 些 情况 下 , 会 有 多 个 主 脚本 ， 因 为 应 用 会 做 多 种 




















不 同 的 事情 。 如 何 写 最 上 层 主 脚本 ， 主 要 有 以 下 3 种 方式 。 
@ ”对 于 小 应 用 来 说 , 可 以 使 用 python3.3some _ script .py 来 运行 程序 。 这 也 是 在 大 多 数 






























































列子 中 所 介绍 的 方式 。 























@ ”对 于 更 大 一 些 的 应 用 ， 会 使 用 一 个 或 多 个 文件 ， 使 用 OS chmoq +x 命令 标记 为 可 执行 文 




























































































牛 。 可 以 将 这 些 可 执行 文件 放 在 Python 的 scripts 目录 中 , 与 setup .py 安装 文件 放 
在 一 起 。 然 后 使 用 命令 行 通过 运行 some_script .py 来 执行 程序 。 
@ 对 于 复杂 的 应 用 ， 可 以 在 程序 包 中 添加 一 个 _main _.py 模块 。 为 了 使 接口 简洁 ， 标 准 库 


















































中 提供 了 runpy 模块 和 -m 命令 行 选项 来 使 用 这 种 特殊 命名 的 模块 。 可 以 使 用 python3.3 


-m some_app 来 运行 。 
我 们 会 详细 介绍 后 两 种 方式 。 


17.4.1 创建 可 执行 脚本 文件 


使 用 可 执行 脚本 文件 时 ， 分 为 两 个 步 又 : 
接 下 来 会 具体 介绍 。 





























使 得 它 可 执行 并 包含 一 个 #! (“shnebang”) 行 。 





我 们 使 用 了 chmod +x some_script .py 来 标记 可 执行 脚本 。 然 后 ， 包 含 了 一 行 shebang。 


#!/usr/bin/env python3.3 





Ye 


序 来 查找 python3 .3 程序 ， 进 而 运 

































































这 一 行 会 引导 OS 使 用 命名 的 程序 来 执行 脚本 文件 。 这 样 一 来 ， 就 使 用 了 /usr/ bin/env 程 
行 了 脚本 。Python3.3 程序 将 提供 脚本 文件 作为 输入 。 


















































一 旦 脚本 文件 被 标记 为 可 执行 并 且 包 含 第 1 行 一 一 就 可 以 在 命令 行使 用 some_ script.py 
来 运行 脚本 。 
对 于 更 复杂 的 应 用 , 最 上 层 脚 本 可 以 用 于 完成 其 他 模块 和 包 的 导入 。 保持 这 些 最 上 层 可 执行 脚 

















本 文件 尽 可 能 的 简单 ， 这 点 是 重要 的 。 有 关 可 执行 脚本 文件 的 设计 ， 之 前 已 经 强调 过 了 。 
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@ 保持 脚本 模块 尽 可 能 的 小 。 
>» @ ”脚本 模块 不 应 该 包含 新 的 或 独特 的 代码 。 它 应 该 总 是 完成 已 
a 有 代码 的 导入 。 

@ 没有 单独 存在 的 程序 。 


及 扩展 性 。 如 果 程 序 的 一 部 分 包含 在 Python 库 中 ， 


我 们 的 设计 目标 中 必须 总 是 包含 组 合 的 思想 以 
分 ， 、 柳 炊 的 。 主 脚本 文件 应 该 尽 可 能 的 简短 , 如 下 代码 所 示 。 


而 在 脚本 目录 中 包含 另外 一 些 部 


import simulation 
with simulation.Logging Config(): 
with simulation.Application Config() as config: 
main= simulation.Simulate Command() 
main.config= config 
main.run() 











一 切实 际 工作 的 代码 都 是 从 一 个 叫 作 simulation 的 模块 中 导入 的 。 在 这 个 模块 中 不 存在 唯 
一 或 特有 的 代码 。 


17.4.2 创建 _main_ 模块 


为 了 使 用 runpy 接口 ， 可 以 使 用 简单 的 实现 。 向 我 们 应 用 中 最 上 层 的 包 中 添加 一 个 小 的 
_ main _.py 模块 。 之 前 已 经 强调 过 了 有 关 最 上 层 可 执行 脚本 文件 的 设计 。 
总 应 该 通过 对 一 个 应 用 进行 重 构 来 创建 更 大 、 更 复杂 组 合 的 应 用 。 如 果 在 _main_ .py 中 包含 了 一 
些 功能 ， 就 需要 将 它们 提 到 其 他 模块 中 ， 以 清晰 的 、 可 导入 的 名 称 来 命名 ， 这 样 就 可 以 被 其 他 应 用 重用 。 
_ main _.py 模块 应 该 看 起 来 像 以 下 代码 这 样 精简 。 


import Simulation 











































































































































































































with simulation.Logging Config() : 
with simulation.Application Config() as config: 
main= simulation.Simulate Command() 
main.config= config 
main.run() 














我 们 对 创建 工作 的 上 下 文 的 过 程 进行 了 最 大 程度 的 化 简 。 所 有 的 实际 工作 都 是 从 包 中 导入 的 。 
并 且 ， 我 们 假设 _main _.py 模块 永 不 会 被 导入 。 


以 上 所 示 就 是 _main “模块 中 应 该 有 的 一 切 。 我 们 的 目的 是 让 我 们 的 应 用 能 够 具有 最 大 化 的 重 
用 能 
17.4.3 ”大 规模 编程 


在 以 上 的 示例 中 , 介绍 了 为 什么 不 能 将 特有 的 实际 工作 代码 放 入 _main _.py 模块 中 。 我 们 将 对 
现 有 的 包 进行 扩展 来 演示 一 个 示例 。 
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可 以 想象 我 们 有 一 个 泛 型 的 静态 包 , 命名 为 stats 和 一 个 最 上 层 的 _main _.py 模块 。 它 的 实 
现 是 基于 命令 行 接口 ， 对 指定 的 csv 文件 进行 描述 性 统计 。 这 个 应 用 包含 了 如 下 所 示 的 命令 行 API。 




































































python3.3 -m stats -c 10 some file.csv 
































命令 行 中 通过 使 用 -c 选项 来 指定 要 分 析 的 列 。 同 时 文件 名 在 命令 行 中 作为 一 个 位 置 参数 被 提供 。 
进一步 假设 ， 我 们 出 现 了 重大 的 设计 问题 。 我 们 在 stats/_main _.py 模块 中 定义 了 一 个 
高 层次 的 函数 analyze () 。 

我 们 的 目的 是 将 它 与 21 点 模拟 进行 结合 。 由 于 出 现 了 设计 失误 ， 因 此 它 不 能 很 好 地 工作 ， 或 
许 我 们 认为 可 以 这 样 做 。 






























































import stats 
import simulation 
import types 
def sim and analyze(): 
with simulation.Application Config() as config sim: 
config sim.outputfile= "some file.csv" 
s = Simulation.Simulate() 
s.run() 
config stats= types.SimpleNamespace( column=10, input="some file. 
csv" ) 


stats.analyze( config stats ) 








使 用 了 stats .analyze() 来 假设 外 层 的 接口 是 包 的 一 部 分 ， 不 是 _main .py 的 一 部 分 。 
这 种 通过 在 ”main () 中 定义 函数 实现 的 简单 组 合 造成 了 不 必要 的 复杂 度 。 
我 们 希望 避免 被 迫 这 样 做 。 





























def analyze( column, filename ) : 
import subprocess 
subprocess.check call( "python3.3 -m stats -c {0} {1}".formatl( 
column, filename) ) 








我 们 应 该 不 必 通 过 命令 行 API 来 创建 可 组 合 的 Python 应用。 为 了 创建 一 个 已 有 应 用 的 合理 
组 成 成 分 , 我 们 需要 对 stats/_main _.py 进行 重 构 , 移 除 模块 中 的 所 有 定义 并 把 它们 放 入 包 中 
从 而 能 够 在 全 局 范围 内 使 用 。 


17.5 设计 长 时 间 运 行 的 应 用 


长 时 间 运 行 的 应 用 服务 会 从 某 种 队列 中 读 取 请 求 并 生成 相应 的 回复 。 在 许多 情况 下 ， 会 使 用 
HTTP 协议 并 将 创建 的 应 用 服务 添加 到 网 络 服务 框架 中 。 有 关 如 何 基于 WSGI 设计 模式 来 实现 
RESTful 的 网 络 服务 ， 可 参见 第 12 章 “ 传 输 和 共享 对 象 ” 

桌面 GUI 应 用 与 服务 有 很 多 共同 的 功能 ， 它 会 从 队列 中 读 取 鼠 标 和 键盘 操作 的 事件 ， 对 每 种 
事件 进行 处 理 并 返回 相应 的 GUI 回复 。 在 一 些 情况 中 ， 回 复 可 能 为 文本 组 件 的 更 新 。 在 另 一 些 情况 
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中 ， 会 打开 或 关闭 一 个 文件 ， 荣 单项 的 状态 可 能 会 发 生 改变 。 
对 于 以 上 两 种 情况 ， 应 用 的 核心 功能 都 是 无 限 循环 的 处 理事 件 或 请 求 。 由 于 这 些 循环 很 简单 
































因此 它们 通常 为 框架 的 一 部 分 。 对 于 GUI 应 用 来 说 ， 可 能 会 使 用 如 下 代码 来 实现 循环 。 











root= Tkinter.Tk() 
app= Application (root) 
root .mainloop () 



































组 件 来 处 理 。 当 对 象 完成 了 事 
法 ， 然 后 循环 会 被 终止 。 












































对 于 Tkinter 应 用 ， 最 高 层 组 件 的 mainloop () 获得 GUI 事件 并 把 它们 交 给 框架 中 的 适当 
事件 的 处 理 一 一 最 上 层 组 件 ， 像 上 例 中 的 root 一 一 会 执行 quit () 方 


















































对 于 一 个 基于 WSGI 的 网 络 服务 框架 ， 可 能 会 使 用 以 下 代码 来 实现 循环 。 


httpd = make server('', 8080, debug) 





httpd.serve forever() 














在 这 个 例子 中 ， 服 务 中 的 serve forever () 方 法 会 得 到 每 个 请 求 并 交 给 应 



































本 例 中 为 depug。 当 应 用 执行 了 服务 的 shutdown () 方 法， 循环 将 被 终止 。 









































通常 还 需要 在 其 他 方面 来 区 分 长 时 间 运 行 的 应 用 。 























来 处 理 一 一 在 




















@ 健壮 性 : 对 于 一 般 情 况 ， 这 种 需求 不 需要 。 所 有 的 软件 都 应 该 能 够 运行 。 然 而 ， 当 需要 与 


















































外 部 OS 或 网 络 资源 交互 时 ， 










































































就 可 能 有 超时 和 其 他 错误 ， 它 们 必须 被 很 好 地 解决 。 对 于 插 
件 式 设计 的 应 用 框架 来 说 ， 插 件 和 扩展 组 件 中 的 错误 应 该 能 够 被 全 局 的 框架 4 
Python 中 原生 的 异常 处 理 就 已 经 足够 用 来 写 出 健壮 的 程序 。 
































民 好 地 处 理 。 


@ 可 审计 : 一 个 简单 的 、 集 中 的 日 志 不 是 在 所 有 情况 下 都 够 用 的 。 在 第 14 章 “Logging 和 Warning 
模块 ”中 ， 我 们 介绍 了 几 种 技术 来 创建 多 种 日 志 用 于 满足 安全 或 金融 审计 方面 的 需求 。 

@ 可 调试 : 原生 的 单元 测试 和 集成 测试 降低 了 复杂 调试 工具 的 需要 。 然 而 ， 对 于 外 部 资源 和 
软件 插件 或 扩展 所 带 来 的 复杂 性 ， 在 不 提供 调试 支持 的 情况 下 ， 它 们 很 难处 理 。 使 用 更 复 















































杂 的 日 志 系统 或 许 会 有 帮助 。 
@ 可 配置 性 : 除了 要 提供 简单 的 补丁 ， 我 们 还 需要 能 够 启用 或 禁用 应 用 的 功能 。 






































UU 


或 禁用 调试 日 志 ， 是 一 种 党 






















































































































































































见 的 配置 。 在 一 些 情况 中 ， 我 们 希望 在 不 需要 完全 终止 并 重启 

































































例如 ， 启 用 























应 用 的 情况 下 来 完成 配置 的 变更 。 在 第 13 章 “ 配 置 文件 和 持久 化 ”中 ， 我 们 介绍 了 一 些 






































有 关 应 用 配置 的 技术 。 在 第 

















16 章 “ 使 用 命令 行 ”中 ， 我 们 扩展 了 这 些 技术 。 
































@ 可 控制 : 对 于 简单 的 长 时 间 运 行 服务 ， 可 以 通过 
缓存 被 清空 并 且 OS 资源 被 释放 ， 使 用 信号 机 制 
































































































































在 signal 模块 中 提供 了 信号 处 理 的 能 








对 于 最 后 两 种 一 一 动态 配置 和 干净 关闭 一 一 使 得 能 够 区 分 主事 件 或 请 求 输入 和 








入 。 这 个 控制 输入 能 够 为 配置 或 关闭 提供 额外 的 请 求 。 





























我 们 有 很 多 方式 能 够 通过 一 个 额外 的 通道 来 提供 异步 输入 。 

















@ ”最 简单 的 方式 之 一 就 是 使 用 








multiprocessing 模块 创建 队列 。 这 样 一 来 ， 


重启 来 完成 对 不 同 配置 的 加 载 。 为 了 确保 
比 SIGKILL 强行 关闭 要 好 一 











些 。Python 





次 要 控制 的 输 

















就 能 够 使 用 
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全 内 六 





GU 
一 般 地 ， 更 多 的 | 


一 些 技术 ( 
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他 操作 。 有关 m 











Python 标准 库 的 入 





























或 状态 对 象 。 



































socket、 











它们 应 该 用 了 























更 高 层 





I 应 用 进行 交互 。 它 们 没有 像 创 建 
青 况 下 我 们 会 使 用 multiprocessing 来 实现 更 高 层面 的 可 上 























单 的 客户 端 管理 程序 来 与 这 个 队列 进行 交互 , 完成 控制 或 查询 服务 , 或 是 通过 GUI 进行 
ultiprocessing 模块 的 更 多 信息 , 可 参见 第 12 章 “ 传 输 和 
门 能 够 在 客户 端 和 服务 之 间 传 递 控 制 
和 18 章 中 定义 了 更 底层 的 技术 。 这 些 模块 也 可 用 于 与 长 运行 的 服务 或 
队列 或 通过 multiprocessing 实现 
































村 象 ” 
~ 村 2 





管道 那样 复杂 。 

















的 API。 底 层 的 





17.6 使 用 src、bin 和 test 来 组 织 代码 




























































































signal、mmap、asyncore 和 asynchat ) 相对 简单 ， 
四 中 模块 的 内 部 支持 ， 例 如 multiprocessing。 



































会 提供 少量 功能 。 









































































































































































































































正如 在 前 面 节 中 所 介绍 的 ， 不 需要 复杂 的 目录 结构 。 简 单 的 Python 应 用 可 以 生成 简单 的 目录 ， 
其 中 可 以 包含 应 用 模块 、 测 试 模块 和 setup .py 以 及 REAME。 这 是 一 种 简单 、 有 效 的 方式 。 

然而 对 于 相对 复杂 的 模块 和 包 ， 经 常 需要 更 结构 化 一 些 。 对 于 复杂 结构 ， 常 用 的 方式 是 将 
Python 代码 分 为 3 部 分 。 举 一 个 具体 的 例子 ， 对 于 名 为 my_app 的 应 用 ， 会 创建 以 下 几 个 典型 的 
目录 。 

@ my app/my app: 这 个 目录 中 包含 了 应 用 的 所 有 代码 。 这 里 包括 了 各 种 模块 和 包 。 只 是 对 
目录 命名 src 提供 的 信息 还 不 够 。 这 个 my_app 目 录 应 该 包含 一 个 空 的 _init .py 文 
件 ， 这 样 应 用 也 充当 了 包 的 角色 。 

@ my app/binor my_spp/scripts: 这 个 目录 中 可 以 包含 任何 来 自 OS 命令 行 API 的 脚 
本 。 可 以 通过 使 用 setup .py 来 将 这 些 脚 本 复制 到 Python 的 scripts 目录 中 。 如 之 前 
所 介绍 的 ， 它 们 应 该 像 _main _.py 模块 那样 非常 简短 ， 并 且 它 们 可 以 被 Python 代码 
当 作 OS 文件 名 的 别名 。 

@ my app/test: 这 个 目录 可 以 包含 不 同 的 unittest 模块 。 这 个 目录 中 也 应 该 包含 一 个 空 的 
:init .py 文件 ， 这 样 它 就 可 以 被 看 作 是 包 。 也 可 以 在 整个 包 中 包含 _main .py 来 运 
行 所 有 的 测试 。 

为 了 避免 缺失 版 本 号 造成 的 困惑 ， 最 上 层 的 目录 名 my_app 可 以 使 用 一 个 版 本 号 来 标记 。 可 以 

使 用 my_app-v1 .1 作为 最 上 层 目 录 名 。 在 最 上 层 目 录 中 的 应 用 必须 有 一 个 适当 的 Python 名 称 ， 




















这 样 就 可 以 将 my_app-v1.1/my_app 作为 应 
崩 安装 到 Python 标 
的 分 支 。 当 然 ， 


为 了 





各 应 有 
可 参见 Python 模块 


















































的 路 径 。 
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库 结构 中 ， 最 上 





层 目 
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这 个 






































当 应 











安装 模块 。 可 以 使 用 PYTHONPATH 环境 变量 来 完成 。 


PYTHONPATH=my_apP Python3.3 -m test 











模块 和 测试 模块 在 不 同 的 目录 中 时 

















录 中 还 需要 包含 一 个 RE 





'ADM. 





录 应 该 包含 setup .py 文件 。 














我 们 在 执行 命令 的 同一 行 设置 了 一 个 环境 变量 。 














可 以 使 ) 














起 来 可 











5 文件。 





详细 信息 

















， 在 运行 测试 的 时 候 需要 对 应 用 进行 引 | 
j 如 下 代码 来 运行 测试 套 








j， 作 为 一 个 
件 。 





能 有 些 奇怪 ， 但 它 是 bash shell 
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的 第 1 级 功能 ， 这 使 得 我 们 可 以 对 PYTHONPATH 环境 变量 做 本 地 化 的 定义 。 





17.7 安装 Python 模块 


关于 Python 模块 和 包 的 安装 ， 有 以 下 几 种 方式 。 

@ 可 以 写 setup.py 并 使 用 分 支 功能 模块 qistutils 来 将 包 安装 到 Python 的 1ib/ 
site-packages 目录 。 可 参见 Python 的 分 支 模块 。 

@ 可 以 在 PYTHONPRATH 环境 变量 中 进行 设置 ， 在 其 中 包含 包 和 模块 。 可 以 临时 的 保存 在 
shell 中 , 或 者 保存 在 ~/pash_profile 或 系统 的 /etc/profile 中 。 在 下 一 节 中 会 对 
此 深入 介绍 。 

@ 可 以 通过 包含 .pth 文件 来 向 导入 路 径 添加 目录 。 这 些 文件 可 以 放 在 本 地 目录 或 
lib/site-packages 来 实现 对 模块 或 包 的 引用 。 更 多 信息 可 以 参见 Python 标准 库 的 
文档 。 

@ 本 地 目录 也 是 一 个 包 。 它 通常 出 现在 sys .path 中 的 第 1 级 。 如 果 创 建 的 是 简单 的 单 模 
块 Python 应 用 ， 它 显得 很 方便 。 对 于 复杂 一 些 的 应 用 ， 当 前 目录 会 随 着 我 们 对 不 同文 件 
的 编辑 而 改变 ， 这 样 一 来 ， 这 种 方式 就 不 合适 了 。 

环境 变量 可 以 被 存 为 临时 的 或 永久 的 。 可 以 使 用 以 下 命令 在 交互 的 会 话 中 对 其 进行 设置 。 


export PYTHONPATH=~/my_app-v1.2/my_apPp 


以 上 设置 完成 后 ， 在 查找 模块 时 ，PYTHONPATH 会 包含 命名 目录 。 通 过 这 样 的 一 个 对 环境 变量 的 
改变 ， 就 完成 了 模块 的 安装 。 并 没有 向 Python 的 1ip/site-packages 目录 中 添加 任何 东西 。 

这 是 一 个 临时 性 的 设置 ， 而 且 在 关闭 终端 会 话 时 修改 可 能 会 丢失 。 一 种 方案 是 修改 
~/ .bash_profile, 保存 对 环境 变量 的 修改 。 只 需要 向 .bash_profile 中 添加 export 这 一 行 ， 
这 样 在 每 次 登录 时 包 就 会 被 使 用 。 

对 于 共享 服务 器 的 用 户 ， 可 以 将 环境 变量 的 设置 放 在 /etc/profile 中 ， 这 样 就 不 必 对 
~/ .bash profile 进行 修改 了 。 对 于 独立 工作 站 的 用 户 ， 比 起 修改 系统 设置 ， 基 于 distutils 
配置 setup .py 会 更 简单 一 些 。 
对 于 Web 应 用 而 言 ， 需 要 修改 Apache 的 配置 ， 包 含 对 必要 的 Python 模块 访问 。 为 了 能 够 快 
速 部 署 修改 后 的 应 用 ,对 于 大 型 的 复杂 应 用 ,通常 不 需要 使 用 setup .py。 通 常会 使 用 一 系列 应 用 
目录 并 做 简单 的 .pth 修改 或 者 PYTHONPRATH 修改 ， 来 将 它们 移 至 新 版 本 中 。 

对 于 以 下 这 种 目录 ， 用 户 为 myapp。 

/Users/myapp/my_app-v1l.2/my_app 

/Users/myapp/my_app-v1.3/my_app 

这 样 就 可 以 在 保持 已 有 版 本 的 基础 上 并 行 地 创建 一 个 新 版 本 。 我 们 可 以 通过 修改 PYTHONPATH 
为 /Users/myapp/my_app-v1.3/my_app 来 完成 从 1.2 版 本 到 1.3 版 本 的 切换 。 
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17.8 总 结 

















我 们 介绍 了 一 些 在 设计 模块 和 包 时 要 考虑 的 点 。 在 模块 和 单 例 类 之 间 做 了 深入 的 对 比 。 在 设计 
一 个 模块 时 ， 数 据 结构 和 过 程 封装 的 一 些 基 本 问题 与 类 设计 时 所 考虑 的 是 相关 的 。 



































当 设计 一 个 包 时 ， 尽 量 不 使 用 过 度 嵌 套 的 结构 。 当 有 多 种 实现 时 ， 我 们 就 需要 使 用 包 ; 我 们 介 








绍 了 几 种 方式 来 应 对 实现 的 变化 。 有 时 需要 定义 一 个 包 ， 将 许多 模块 组 合 起 来 放 入 这 个 包 中 。 我 们 
.py 来 完成 包 内 部 的 导入 。 


17.8.1 设计 要 素 和 折 中 方案 


对 于 很 深 的 包 层 次 结构 ， 可 以 将 功能 组 织 到 定义 的 函数 中 。 可 以 对 所 定义 的 函数 和 它们 的 相关 
数据 进行 组 织 ， 放 入 一 个 类 中 。 我 们 可 以 将 相关 类 组 合 为 一 个 模块 ， 并 将 相关 模块 组 合 为 一 个 包 。 

















介绍 了 如 何 使 用 _init 





























。 模 块 为 Python 软件 结构 、 分 支 、 
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当 我 们 将 软件 理解 为 一 种 用 于 获取 并 表示 信息 的 语言 时 ， 就 需要 思考 类 和 模块 所 代表 的 是 什 
使 用 和 重用 的 单元 。 为 了 减少 异常 ， 模 块 的 设计 必须 考虑 到 














对 于 大 多 数 情况 ， 我 们 会 使 用 类 ， 因 为 会 


类 中 会 包含 有 状态 的 实例 变量 。 














当 考虑 使 用 单 例 类 时 ， 






































在 可 能 和 单 例 类 的 意义 是 相同 的 。 在 一 些 情况 














如 果真 正 需 要 类 ， 





| 长 

















在 一 般 情况 下 , 会 使 / 





有 状态 的 模块 














需要 创建 类 的 多 个 实例 。 通 常 ( 但 不 是 所 有 情况 )， 

















那么 使 用 单 例 的 必要 就 不 是 很 明显 了 。 独 立 函 数 的 存 
中 ， 模 块 中 独立 的 函数 很 适用 ， 因 为 模块 是 可 继承 的 





























地 变量 的 命名 空间 。 














当 创 建 不 可 变 类 时 (使 用 slots ， 扩 











例如 有 状态 的 类 。 模块 就 是 一 个 包含 了 可 被 修改 的 本 











[二] 


展 tuple， 或 重 写 属性 的 setter 方法 )， 我 们 不 能 

















够 轻易 地 创建 一 个 不 可 变 模 块 。 几 乎 没有 一 个 模块 是 不 可 变 对 象 。 



























































小 型 应 用 可 以 为 单一 模块 。 大 型 应 用 通常 为 一 个 包 。 由 于 模块 化 设计 的 需要 ， 包 通常 被 设计 为 

















可 重用 的 。 更 大 应 用 的 包 中 应 该 包含 一 个 _main 模块。 


17.8.2 ”展望 
在 下 一 章 中 , 我们 会 综合 

















考虑 因素 是 要 确保 我 们 的 软件 是 可 信任 





应 用 一 些 面 向 对 象 的 设计 技巧 。 统 观 设计 与 实现 的 质量 问题 , 划 
































一 个 















































的 ， 而 可 信任 的 一 个 方面 就 是 具备 连贯 的 、 易 用 的 文档 . 
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8 章 


质量 和 文档 








好 的 软件 不 是 偶然 产生 的 而 是 精 恢 多 


























会 介绍 两 种 从 代码 生成 文档 的 了 
Sphinx 工具 的 能 力 。 我 








以 增强 
文档 是 软件 
一 种 方法 














。 用 doctest 编 
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质量 的 一 个 








pi 
pi 


会 介绍 一 些 ReStructured Text (RST) 站 

















四 琢 出 来 的 。 一 个 可 交付 的 产品 包含 可 读 的 、 准 确 的 文档 。 我 们 














:pydoc 和 Sphinx。 如 果 使 用 一 个 轻 量 级 的 标记 语法 来 编写 文档 ， 可 








的 功能 来 让 文档 
































写 
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门 还 会 简 六 











时 ， 这 个 文档 包含 














来 高 质量 的 代码 用 


为 help () 函数 编写 docstr ings 


18. 1 











介绍 大 纲 式 编程 技术 。 这 种 
所 有 的 带 有 注释 和 设计 如 


要 方面 ， 它 是 建立 信任 的 其 


二 个 方 











鲁 。 测 试 / 




















测试 用 例 同时 
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让 
































0 非常 清晰 、 














完整 的 文档 。 








[达到 了 这 两 个 质 


是 . 西 


里 廊 


S 
yy 
o 





j 例 是 建立 





的 可 读 性 更 好 。 


言 任 的 另外 





技术 的 主要 目 
的 源 代码 。 大 纲 式 编程 




















As 所 


Zh 







































































简单 ， 

















的 文档 。 同 
以 为 我 们 





Hh 


人 







































































































































































Python 为 我 们 提供 了 许多 地 方 可 以 编写 文档 。 包 、 模 块 、 类 或 者 函数 的 定义 中 都 包含 一 个 描述 
被 定义 对 象 的 字符 串 。 在 本 书 中 ， 我 们 没有 在 任何 例子 中 使 用 文档 注释 (docstrings )， 因 为 我 们 主要 
关注 Python 的 编程 细节 ， 而 不 是 需要 交付 的 、 完 整 的 软件 产品 。 

当 我 们 开始 学 习 高 级 面向 对 象 设计 技术 并 且 关 注 整 个 可 交付 的 产品 时 , 文档 注释 就 成 为 可 交付 
产品 中 的 一 个 重要 部 分 了 。 文 档 注 释 可 以 为 我 们 提供 一 些 重 要 的 信息 。 

@ API: 参数 、 返 回 值 和 抛 出 的 异常 。 

@ ”对 预期 行为 的 描述 。 

@ 可 选 的 , 提供 doctest 的 测试 结果 。 更 多 关于 测试 的 信息 , 参见 第 15 章 “ 可 测试 性 的 设计 ” 

当然 ,我 们 可 以 在 文档 注释 中 包括 更 多 的 信息 。 我 们 可 以 提供 关于 设计 、 架 构 和 需求 的 更 多 细 


节 。 在 某 些 时 候 





























些 


， 这 些 更 抽 








属于 代码 或 





文档 注释 。 











可 











help () 函数 提取 并 显示 文档 注释 ， 它 会 对 文本 执行 
过 site 包 安 装 在 交互 式 Python 环境 中 。 这 个 功能 实际 上 是 定义 在 pydoc 包 中 的 。 大 体 上 ， 我 们 




















和 











展 这 个 包 来 

















定义 help() 的 输出 。 


象 、 高 级 的 问题 和 Python 代码 没 












































些 雪 





有 直接 关系 。 这 利 





坡 本 的 格式 化 操作 。help () 函数 通 





高 级 设计 和 和 需求 不 
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四 
o 





编写 适合 help () 的 文档 相对 简单 。 下 面 是 help (roung) 的 一 个 典型 输 














round(...) 
round (number[, ndigits]) -> number 


Round a number to a given precision in decimal digits (default 0 


digits). 
This returns an int when called with one argument, otherwise the 


same type as the number. ndigits may be negative. 

这 段 代码 展示 了 编写 文档 所 有 必要 的 元 素 : 总 结 、API 和 描述 。API 和 总 结 在 第 1 行 : 

function( parameters ) -> results。 

描述 文本 定义 了 函数 的 功能 。 更 复杂 的 函数 可 能 会 对 异常 或 者 对 这 个 函数 非常 重要 的 、 唯 
一 的 边界 情况 进行 描述 。 例 如 ，round() 函数 没有 描述 细节 、 可 能 抛 出 的 TypeError。 

一 个 面向 nelp () 的 文档 注释 应 该 是 不 带 有 任何 标记 的 纯 文本 。 我 们 添加 一 些 RST 标记 ， 

是 help () 不 会 使 用 这 些 标记 。 

我 们 只 需要 提供 文档 注释 ，nelp () 就 会 开始 工作 。 由 于 这 种 做 法 非常 简单 ， 因 此 没有 任何 原 

因 不 这 么 做 。 每 个 函数 和 类 都 需要 一 些 文档 注释 ， 这 样 nelp () 就 可 以 显示 一 些 有 用 的 信息 。 


18. 2 ”用 pydoc 编写 文档 


我 们 用 库 模 块 pydoc 从 Python 代码 中 生成 HTML 文档 。 当 我 们 在 交互 式 Python 环境 中 使 用 
help () 时 ， 就 是 在 使 用 这 个 模块 。 这 个 函数 会 生成 不 带 标记 的 、 基 于 文本 模式 的 文档 。 
当 我 们 用 pydoc 生成 文档 时 ， 我 们 会 以 下 面 3 种 方式 中 的 一 种 来 使 用 它 。 
@ 准备 文本 模式 的 文档 文件 ， 然 后 用 命令 行 工具 例如 more 或 者 less 查看 它们 。 
@ 准备 HTML 文档 并 且 保存 在 文件 中 以 供 之 后 的 浏览 使 用 。 

@ 运行 一 个 HTTP 服务 器 并 且 创 建 需要 立刻 浏览 的 HTML 文件 。 
我 们 可 以 运行 下 面 的 命令 行 工具 为 某 个 模块 准备 基于 文本 的 文档 。 
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pydoc somemodule 


我 们 也 可 以 使 用 下 面 的 代码 。 


python3.3 -m pydoc somemodule 























任意 一 个 命令 都 会 基于 Python 代码 创建 文本 文档 。 关于 输出 的 显示 , 可 以 使 用 less (在 Linux 
或 Mac OSX 上) 或 more (在 Windows 上 ) 命令 ， 这样 可 以 将 大 量 的 输出 在 程序 中 分 页 显示 。 
在 一 般 情 况 下 ，pydoc 会 假设 我 们 提供 了 要 导入 的 模块 名 称 。 这 意味 着 该 模块 必须 在 Python 
的 导入 路 径 中 。 另 外 一 种 方式 是 ， 我 们 可 以 通过 包含 一 个 路 径 分 隔 符 /〈 在 Linux 或 MacOSX 上 ) 
或 \( 在 Windows 上 ) 来 指定 一 个 带 有 .py 扩展 名 的 物理 文件 名 。 某 些 类 似 pyqoc . /mymoqule .py 
的 命令 可 以 获取 导入 路 径 之 外 的 文件 。 






































































































































18.3 通过 RST 标记 提供 更 好 的 输出 411 


























我 们 可 以 用 -w 选项 来 查看 HTML 文档 。 这 个 选项 会 将 HTML 文件 写 到 本 地 目录 中 。 








python3.3 -m pydoc -w somemodule 


然后 ， 我 们 可 以 在 浏览 器 中 打开 somemodule .html 来 读 取 给 定 模块 的 文 























一 个 用 于 特殊 目的 的 Web 服务 器 来 浏览 包 或 模块 的 文档 。 除 了 简单 地 启动 一 个 服务 器 之 外 ， 我 们 可 

















以 将 启动 服务 器 和 加 载 默认 浏览 器 的 过 程 进行 合并 。 下 面 是 在 8080 端口 启动 一 


Python3.3 -m pydoc -p 8080 

















档 。 第 3 个 选项 是 启动 

















个 服务 器 的 简单 方式 。 























这 行 命令 会 启动 一 个 HTTP 服务 器 ,这 个 服务 器 会 查询 当前 目录 中 的 代码 。 如 果 当 前 的 目录 是 

















个 正确 的 包 ( 也 就 是 包含 一 个 _init .py 文件)， 那 么 这 个 服务 器 就 会 创建 一 个 顶层 模块 索引 。 












































Web 服务 器 上 共享 这 个 文档 。 
我 们 也 可 以 同时 启动 一 个 本 地 服务 器 和 一 个 浏览 


Python3.3 -m pydoc -b 














旦 我 们 启动 了 一 个 服务 器 ， 就 可 以 将 浏览 器 定位 到 http://localhost:8080 来 查看 文档 。 我 们 也 
可 以 利用 重 写 规 则 指向 这 个 pyqdoc 服务 器 上 的 一 个 本 地 Apache 服务 器 , 这 样 








我 们 的 团队 就 可 以 在 





这 行 命令 会 定位 一 个 未 被 使 用 的 端口 、 启 动 一 个 服务 器 ,然后 启动 指向 这 个 服务 器 的 默认 浏览 



































器 。 请 注意 ， 这 里 使 用 了 python3 .3 命令 ， 这 在 老 版 本 的 Python 中 无 法 工 











作 。 














自 定 义 pydoc 的 输出 不 容易 。 各 种 样式 和 颜色 都 有 效 地 硬 编码 在 类 定义 中 。 修 改 和 扩展 
























































pydoc， 让 它 可 以 使 用 外 部 的 CSS 样式 会 是 一 项 很 有 趣 的 工作 。 


18.3 通过 RST 标记 提供 更 好 的 输出 


















































我 们 可 以 使 用 一 个 更 完善 的 工具 集 使 文档 变 得 更 好 。 有 几 件 事情 我 们 希望 人 


























@ 调整 演示 文档 ， 包 含 一 些 重点 标记 ， 例 如 粗 体 、 和 斜体 和 颜色 。 
为 参数 、 返 回 值 、 异 常 和 Python 对 象 间 的 交叉 引用 提供 语义 标记 。 
提供 查看 代码 的 链接 。 































































































@ 修改 CSS 为 生成 的 HTML 页 面 提供 不 同 的 样式 。 



































我 们 可 以 通过 在 文档 注释 中 使 用 更 完整 的 标记 满足 前 两 个 要 求 ， 我 们 需要 









































为 了 满足 后 3 个 要 求 ， 我 们 需要 一 个 额外 的 工具 。 


























做 ， 如 下 所 示 。 








过 滤 包 含 的 或 者 被 拒绝 的 代码 。 我 们 可 以 调整 这 个 筛选 机 制 来 包含 或 者 去 除 一 些 组件 和 成 
员 : 标准 库 模 块 、 以 _ 开 头 的 私有 成 员 、 以 _ 开 头 的 系统 成 员 或 者 基 类 成 员 。 





用 到 RST 标记 语言 。 








一 旦 我 们 开始 使 用 更 完整 的 标记 ， 就 可 以 拓展 HIML， 让 它 包含 可 以 4 
LaTex。 这 使 得 我 们 可 以 从 一 个 单独 的 输入 源 生成 除 HTML 外 的 PostScript 












































成 格式 更 好 的 文档 的 
或 者 PDF 输出 。 








RST 是 简单 的 轻 量 级 标记 。Python 的 docutils 项 目 有 许多 很 好 的 教程 和 总 结 ， 更 多 的 细节 可 


























以 参见 http://docutils.sourceforge.net。 
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下 面 的 页 面 有 一 个 快速 











docutils 工具 集 的 


的 标记 。HTML 和 XML 











依赖 


TI 


目的 是 为 我 们 提供 一 个 非常 聪明 的 解析 器 , 这 样 我 们 就 可 以 使 用 非常 简单 
相对 简单 的 解析 器 ， 把 创建 复杂 标记 的 职责 留 给 用 户 ( 或 者 编辑 





人 席 : http://docutils.sourceforge.net/docs/user/rst/quickstart.html。 


































































































工具 )。 XML 和 HTML 可 以 在 各 利 














不 同 的 情景 中 使 用 , 但 是 docutils 解析 器 主要 针对 自然 语言 文本 。 























正 是 因为 这 种 相对 狭窄 的 针对 面 ，docutils 能 够 基于 空白 行 和 一 些 ASCII 的 标点 推 类 我 们 的 目的 。 
对 我 们 来 说 ，docutils 解析 器 可 以 解析 下 面 3 种 基本 的 文本 。 


@ 文本 块 : 段落 、 头 、 列 3 引 
现在 文本 块 ! 


@ 内 联 标记 可 以 出 






































re 





j、 代 码 示例 和 doctest 块 。 这 些 文本 通过 空 行 分 隔 。 




















记 ， 我 们 会 在 后 




















@ 指令 也 是 文本 块 , 但 是 
扩展 为 向 docutils 中 添加 功能 的 工具 。 


18.3.1 文本 块 














文本 块 就 是 一 个 简单 的 段落 ， 通 过 空 行 与 其 他 段落 分 隔 。 这 是 RST 标记 的 基本 单元 。RST 基 
于 使 用 的 模式 可 以 识别 许多 不 同 种 类 的 段落 ， 下 面 是 一 个 标题 的 例子 。 











This Is A Heading 























这 行文 字 会 被 解析 为 标题 ， 因 为 它 以 











。 这 包括 用 简单 的 标点 在 文本 块 中 标记 字符 。 有 两 种 内 联 标 
用 的 部 分 介绍 一 些 关 于 这 两 种 标记 的 细节 。 
站 令 以 . . 作为 每 行 开头 的 前 两 个 字符 。 指 令 是 开放 式 的 并 且 可 以 被 





可- 

















































































































一 连 串 的 特殊 字符 作为 下 划 线 。 

















docutils 解析 器 完全 根据 标题 的 使 用 方式 推断 出 标题 的 层次 。 我 们 必须 与 标题 和 它们 的 嵌 套 方 





式 保持 一 致 。 这 样 的 做 法 有 











肋 于 选择 和 保持 一 个 标准 。 这 样 的 做 法 还 有 有 











于 保持 文档 的 平坦 ， 避 免 引 入 





二 











复杂 的 肉 套 标题 。 通 常 只 需要 


列表 项 目 以 特殊 字符 3 





3 个 层次 ， 这 意味 着 我 们 可 以 使 用 ====、---- 和 ~~~~ 作 为 这 3 个 层次 。 











乎 可 以 使 用 任何 一 致 的 缩 进 都 可 以 。 








Bullet Lists 


本 Leading Special Character. 


每 Consistent Indent. 


注意 段落 间 的 空 行 。 对 于 茶 些 类 型 的 简单 项 目 列表 ， 空 行 不 是 必需 的 。 通 常 ， 使 用 空 行 会 是 一 


个 好 主意 。 





数字 列表 以 数字 或 者 字符 


















































于 头 ， 内 容 必 须 缩 进 。Python 和 RST 都 使 用 4 个 空格 的 缩 进 。 但 是 ， 几 





















































F 头 。 如 果 需 要 自动 生成 数字 ， 可 以 用 # 作 为 列表 项 目的 开头 。 








和 罗马 数字 天 





Number Lists 


1. Leading digit or letter. 


2. Auto-numbering with #. 








18.3 通过 RST 标记 提供 更 好 的 输出 413 


#. Looks like this. 

我 们 可 以 利用 这 种 缩 进 规则 在 列表 中 创建 列表 。 它 可 能 很 复杂 ， 但 是 aocutils 的 RST 解析 
器 通常 都 能 够 理解 你 的 意图 。 

引用 文字 块 就 是 简单 的 缩 进 文本 。 














































































































Here's a paragraph with a cool quote. 


Cool quotes might include a tip. 


Here's another paragraph. 
































通过 : : 双 冒 号 表示 代码 示例 ， 代 码 块 会 缩 进 并 且 以 空 行 结束 。 尽 
作为 独立 的 行 ， 将 : : 作为 独立 的 行 让 我 们 可 以 更 容易 找到 代码 示例 。 
下 面 是 代码 示例 。 





x 
获 


: :可 以 放 在 行 末 或 者 自身 























x = Deck () 
first card= x.pop() 
This shows two lines of code. It will be distinguished from surrounding text. 


docutils 解析 器 也 会 定位 doctest 的 素材 并 将 它 设 定 为 特殊 格式 ， 与 处 理 代 码 块 的 方法 类 
似 。 它 们 以 >>> 开 头 ， 以 空 行 结 

下 面 是 soctest 生成 的 一 些 示 例 输出 。 

>>> x= Unsorted Deck () 


>>> x.pop() 
1 和 Am 


测试 的 输入 结果 中 最 后 的 空 行 是 必需 的 ， 但 是 这 个 空 行 也 很 容易 被 忽略 。 


18.3.2 RST 内 联 标 记 


在 大 多 数 文 本 块 中 ， 我 们 可 以 包含 内 联 标记 。 但 不 能 在 代码 示例 或 doctest 块 中 包含 内 联 标 
记 。 请 注意 ， 也 不 能 内 肉 内 联 标记 。 
RST 内 联 标记 包含 许多 常见 的 ASCI 文本 处 理 。 例如， 我 们 通常 用 *emphasis* 和 **strong 
emphasis** 分 别 生 成 斜体 和 粗 体 。 我 们 可 能 想 强调 文本 块 中 的 代码 段 ， 用 "literal" 强 制 使 用 
等 宽 字 体 。 
我 们 也 可 以 在 内 联 标 记 中 包含 交叉 引用 。 尾 随 的 _ 意 味 着 指向 引用 ， 前 置 的 _ 意 味 着 指向 目标 。 
例如 ， 我 们 可 能 以 "some phrase'_ 作 为 引用 。 然 后 ， 可 以 使 用 _' some phrase' 作 为 这 个 引用 
的 目标 。 我 们 不 需要 为 节 标 题 提 供 显 式 的 目标 : 我 们 可 以 引用 'This Is A Heading' _， 因 为 所 
有 的 节 标 题 都 已 经 定义 为 目标 。 对 于 HTML 输出 ， 这 会 生成 我 们 所 预期 的 <a> 标 记 。 对 于 PDF 输 
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LH 
LIy 





我 们 不 能 


Sphinx 时 ， 有 许多 
当 所 做 的 
用 :math : 











18.3.3 


RST 也 包含 指令 。 
数 。RST 包含 了 大 量 的 可 以 ) 





会 生成 文本 链接 。 
伟 内 联 标记 。 很 少 有 情 
觉 上 的 混乱 。 如 果 我 们 需要 使 ) 

内 联 标记 也 
对 比较 少 。 






































可 以 包含 显 式 的 

















] 很 多 提 





FE 版 技巧 ， 那 么 我 们 


色 指 示 器 。 写 法 是 :role: 跟 着 'text'。 人 简 自 


况 会 需要 使 用 内 联 标记 ， 使 有 

















LaTex 。 








可 能 应 该 直接 用 
































我 们 可 以 考虑 用 :code:'some code' 明 确 



































Rill 





E 情 




















色 


D> 














RST 指令 
































色 指 示 器 。 使 
包含 了 复杂 的 数学 
它 看 起 来 类 似 后 面 这 样 : 
角色 是 开放 式 的 。 我 们 可 以 为 aocutils 提供 


指令 写 在 以 . .开头 的 块 
j 来 创建 更 完 























jj 显 式 的 角色 可 以 提供 
既 念 时 ,我 们 可 以 考虑 用 LaTex 的 数学 排版 功能 。 











表示 文本 ， 
量 的 











语义 信息 。 











:math:'a=\pi r^2'。 





个 配置 来 添加 妆 


色 。 


折 的 角 


























日 太 多 的 排版 技巧 反而 会 带 来 视 


和 的 RST 角色 相 
有 代码 存在 。 当 我 们 介绍 











这 种 功能 使 




















二 
二 
口 


文档 的 指令 。 








对 于 准备 文档 


， 可 能 会 包含 一 些 缩 进 的 内 容 ， 也 可 能 包含 一 些 参 
字符 串 ， 我 们 很 少 会 使 用 
具 会 通过 添加 指令 生成 更 完善 的 文档 。 





全 
过 


3 个 常用 的 指令 是 image、csv-table 和 math。 如果 我 们 的 文档 中 包含 一 张 图 片 ， 我 们 可 





























多 的 指令 。 指 令 是 开放 式 的 ， 例 如 Sphinx 这 样 的 工 
以 用 下 面 的 方式 包含 它 。 
. image:: media/some file.png 


我 们 将 文件 命名 为 media/some file.png。 我 们 也 为 它 提供 了 
片 与 文档 页 的 布局 吻合 。 还 有 


仿 
© 
全 
© 
湖 
多 
对 了 
符 5 


:width: 6in 























width 参数 来 确 

















些 参 








也 的 

















数 可 以 J 





SE 











] 来 调整 图 





片 的 显示 。 





保 我 们 的 图 





:align: 我 们 可 以 提供 关键 字 ， 例 如 top、middqle、bottom、1left、cente 或 者 


right。 这 个 值 作为 HTML 








:alt: 这 是 男 外 一 种 











的 <img> 标 记 








:height: 这 个 参数 代表 图 片 的 高 度 。 


:scale: 这 个 参数 代表 比例 因子 ， 可 以 月 





的 align 属性 的 值 。 
图 片 的 表示 方法 ， 这 个 值 被 作为 HTML 的 <img> 标 记 的 alt 属性 的 值 。 





























:width: 这 个 参数 代表 图 片 的 宽度 。 





:target: 这 是 图 片 的 目标 超 链接 。 这 可 以 是 一 个 完整 的 URI 或 者 一 个 'name' 表单 














RST 引 








Jo 





我 们 可 以 用 以 下 面 的 方式 在 文档 


:Sv-table: 








高 度 和 宽度 ，CSS 中 任何 长 度 的 单元 都 可 以 使 月 
的 高 度 )、px (像素 ) 和 绝对 尺寸 : in、cm、mm、pt (point) 和 pc (pica)。 














Suits 


:header: symbol, name 








含 一 个 表 。 





崩 这 个 因子 代 蔡 高 度 和 宽度 。 














的 


日。 这 包括 em 元 素 字 体 的 高 度 )、ex〈 字 


这 人 允许 我 们 ) 





1 
NT 
pp 
Tra'' 


Ts 
Diamonds 
Hearts 
， Spades 























示 一 个 更 复杂 的 公式 。 


. math:: 
c=2 \pir 
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简单 的 CSV 标记 表示 一 个 复杂 的 HTML 表格 的 数据 。 我 们 可 以 用 math 指令 表 








由 






































这 允许 我 们 编写 作为 独立 方程 式 的 更 复杂 的 LaTex 数学 表达 式 。 这 些 表达 式 也 可 以 进行 编号 和 

















交叉 引用 。 





18.3.4 学 习 RST 


学 习 使 用 RST 的 一 种 方法 是 安装 docutils 并 且 用 rst2html .py 脚本 来 解析 RST 文档 , 然 


后 将 它 转换 为 HTML 页 面 。 通 过 一 个 简单 的 测试 文档 就 可 以 轻松 地 向 我 们 展示 RST 的 不 同 特性 。 
的 需求 、 架 构 和 文档 都 可 以 用 RST 编写 ， 然 后 转换 为 HTML 或 
写 用 户 故事 ， 然 后 将 这 些 文件 放 入 一 个 可 以 随 着 这 些 故 事 被 讨论 、 投 入 天 
， 这 样 的 做 法 是 相对 快速 的 。 一 些 更 复杂 的 工具 可 能 并 不 会 
使 用 纯 文本 文件 和 RST 标记 的 优势 是 我 们 可 以 同时 轻松 地 管理 


所 有 项 目 





























录 






























































































































































的 文字 处 理 文件 格式 。 我们 没 





















































须 压缩 。 我 们 只 是 存储 更 多 的 文本 和 源 代码 。 
如 果 我 们 使 用 RST 创建 文档 ， 也 可 以 使 用 rst21atex.py 脚本 创建 .tex 文件 ， 通 过 运行 

























































































LaTex 工具 全 





























可 以 基于 这 个 文件 创建 postscript 或 者 PDF 文档 。 这 需要 月 
我 们 会 使 用 TexLive。 人 参见 http://www.tug.org/texlive/， 这 个 页 二 
转换 为 优雅 的 最 终 文 件 。TexLive 包含 了 可 以 用 来 将 LaTex 的 输入 转换 为 PDF 文 


















































18.4 ”编写 有 效 的 文档 字符 串 








们 编写 文档 


> Ar 中 


字符 串 时 ， 不 应 该 超过 下 面 的 两 个 边界 。 
@ 最 好 避免 抽象 概述 、 高 层 需求 、 用 户 故 事 或 者 没有 直接 与 代码 相关 的 
让 文档 字符 串 专 注 于 代码 本 身 。 我 们 应 该 在 一 个 独立 的 文档 


使 用 元 长 的 HTML 或 者 XML 标记 ， 这 些 











介绍 了 一 组 更 











当 编写 文档 字符 串 时 ， 我 们 需要 考虑 我 们 的 受众 需要 的 基本 信息 是 什 














库 模 块 时 ， 我 们 需要 知道 什么 ? 不 管 我 们 问 什 么 问题 ， 其 他 的 程 






















































































者 LaTex。 用 RST 编 

















发 和 实现 而 重新 组 织 的 目 
上 aocutils 更 具有 价值 。 


文档 和 代码 。 我 们 没有 使 用 专 










































































标记 语法 在 真实 项 目 中 必 























日 到 LaTex 工具 集 ， 通 常 ， 
完善 的 工具 ， 可 以 将 Tex 





























么 。 当 
也 会 有 同样 的 问题 。 当 我 





牛 的 pdfTex 工具 。 





当 我 们 介绍 如 何 使 用 








背景 信息 。 我 们 应 该 











EY 
































这 样 的 工具 可 以 将 背景 材料 和 代码 合并 到 一 个 单独 的 文档 中 。 
@ 最 好 也 避免 过 度 详细 地 描述 这 个 实现 的 工作 细节 。 因 为 代码 都 是 现成 的 ， 所 以 没有 理由 在 文 












































档 中 重复 代码 。 妇 

















提供 符 中 信 息 o 类 似 Sphinx 





























[I 果 代码 写 的 太 星 涩 难 懂 ， 那 么 我 们 可 能 需要 重 写 ， 把 它 写 得 更 清晰 一 些 。 
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开发 者 想 知 道 的 最 重要 的 事情 可 能 是 一 个 关于 如 何 使 用 
记 :: 的 文本 块 是 这 些 示例 的 骨干 。 
我 们 通常 会 用 下 面 的 方式 编写 代码 示例 。 


























Here's an example:: 


一 个 缩 进 块 之 前 的 双 冒 号 :: 让 这 个 缩 进 块 被 RST 解析 器 识别 为 一 段 代 码 , 并 


d= Deck () 
c= d.pop() 


























传递 给 最 终 的 文档 。 


除了 示例 之 外 ， 正 式 的 API 描述 也 非常 重要 。 我 们 会 在 后 面 的 部 分 中 介绍 一 遇 
单 〈field list) 语法 。 这 种 语法 非常 简单 
可 编写 示例 和 API 之 后 ， 还 会 有 一 些 其 他 因素 需要 考虑 。 我 们 还 需要 哪些 其 他 元 


技术 。 这 些 技术 都 基于 RST 的 字段 ; 
我 们 了 解 了 如 



















































































素 依 赖 于 上 下 文 ， 大 约 有 以 下 3 种 情况 。 


@ 文件 《包括 包 和 模块 ): 在 i 
介绍 。 我 们 需要 在 文件 中 提 
我 们 可 以 在 这 个 级 别 上 提供 


我 们 会 介绍 这 些 
18. 5 


包 和 模块 的 


、 全 





Blackjack Cards and 





类 (包括 方法 函数 ): 
由 于 类 可 能 是 有 状态 

















的 而 
独立 的 方法 函数 通常 都 会 有 六 





文 些 例子 











Python 对 象 的 示例 程序 。 使 用 














RST 标 

















会 以 文本 的 形式 














[ey 





描述 API 定义 的 
这 也 让 它 非常 灵活 。 






































， 我 们 为 一 系列 的 模块 、 类 或 者 函数 提供 了 概览 或 














{一 个 简单 的 蓝 轿 











pe 





doctest 和 代码 示例 。 














我 们 通常 会 在 这 里 提供 用 

















或 者 不 同 元 素 的 概览 。 当 模块 相对 比较 小 时 ， 
























































函数 : 我 们 可 以 提供 


的 ， 所 以 我 们 可 以 包含 一 个 相对 简单 的 API 描述 。 
专注 于 help () 函数 的 文档 。 
广泛 的 、 模 糊 的 文档 上 下 文中 的 一 些 细节 。 











RST 标记 并 




















可 能 包含 相对 复杂 的 APTL， 


# 细 的 文档 来 描述 它们 。 








首 述 类 API 的 代码 实例 和 qoctest 块 。 





出 我 们 可 能 需要 提供 更 长 的 文档 。 





于 讲解 函数 的 代码 示例 和 qoctest 块 。 因 为 函数 通常 是 没有 状态 






































在 一 些 情况 下 ， 我 们 可 以 避免 更 复杂 的 














编 与 文件 级 别 的 文档 字符 串 一 一 包括 模块 和 包 




















述 。 




















De 


cks 








This module contains a definition of "Card", 
suitable for Blackjack. 
The "Card" class hierarchy 























掉 的 模块 文档 字符 串 。 











"Deck" 


目的 是 包含 一 系列 的 元 素 。 包 可 以 包含 模块 、 类 、 全 局 变量 和 函数 。 模 块 可 以 包含 
局 变量 和 函数 。 这 些 容器 顶层 的 文档 字符 串 可 以 作为 描述 包 或 模块 的 通用 特性 的 蓝图 。 
的 细节 留 给 各 个 类 或 函数 来 描 i 

我 们 可 能 会 有 一 个 类 似 下 
































\ 体 








and "Shoe" 


The "Card" class hierarchy includes the following class definitions. 
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"Card" is the superclass as well as being the class for number 
cards. 

"FaceCard" defines face cards: J, Q and K. 

"AceCard" defines the Ace. This is special in Blackjack because it 
creates a soft total for a hand. 

We create cards using the "card()" factory function to create the 
proper 

"Card" subclass instances from a rank and suit. 

The "suits" global variable is a sequence of Suit instances. 

>>> import cards 

>>> ace clubs= cards.card( 1, cards.suits[0] 
>>> ace clubs 

1Aw 

>>> ace diamonds= cards.card( 1, cards.suits[1] ) 





>>> ace clubs.rank == ace diamonds.rank 
True 


The "Deck" and "Shoe" class hierarchy 





The basic "Deck" creates a single 52-card deck. The "Shoe" 

subclass creates a given number of decks. A "Deck" can be shuffled 
before the cards can be extracted with the "pop()" method. A 

"Shoe" must be shuffled and *burned*. The burn operation sequesters 

a random number of cards based on a mean and standard deviation. The 
mean is a number of cards (52 is the default.) The standard deviation 
for the burn is also given as a number of cards (2 is the default.) 


这 个 文档 字符 串 中 大 部 分 的 文本 为 这 个 模块 的 内 容 提 供 了 蓝图 。 它 描述 了 类 层次 ， 让 我 们 可 以 


















































更 容易 地 定位 一 个 相关 的 类 。 


块 的 一 个 重要 功能 。 为 Shoe 类 提供 doctest 说 明 可 能 是 有 意义 的 ， 因 为 这 个 类 可 


















































文档 字符 串 包 含 基于 doctest 的 card() 工厂 函数 的 一 个 简单 示例 。 它 指出 这 个 函数 是 整个 模 
能 是 这 个 模块 





























最 重要 的 部 分 。 





的 副标题 。 


HTML 文档 。 
































这 个 文档 字符 串 包含 了 一 些 内 联 的 RST 标记 ， 这 些 标记 用 等 宽 字 体 表 示 类 名 。 这 些 节 标 题 以 
和 --- 作 为 下 划 线 。RST 解析 器 可 以 识别 出 以 === 作 为 下 划 线 的 标题 是 以 --- 作 为 下 划 线 的 标题 







































































我 们 会 在 后 面 的 章节 中 介绍 如 何 用 Sphinx 生成 文档 。Sphinx 会 使 用 RST 标记 生成 外 观 好 看 的 











18.5.1 用 RST 标记 编写 详细 的 API 文档 
































使 用 RST 标记 的 好 处 是 能 够 提供 正式 的 API 文档 。API 参数 和 返回 值 用 RST 的 字段 列表 格式 





Ls 


化 。 通 常 ， 字 段 的 格式 如 下 。 


:fieldl: some Value 
:field2: another value 
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字段 列表 是 一 系列 的 字段 标签 ( :1abel:) 和 一 个 与 标签 相关 的 值 。 
参数 列表 也 被 用 于 向 指令 提供 参数 。 
字段 列表 的 文本 出 现在 RST 文档 中 时 ，qdocutils 工具 可 以 创建 一 个 美观 的 、 类 似 表 格 的 


要 ， 





值 可 能 很 长 。 

















| 











输出 。 在 PDF 中 ， 它 看 起 来 可 能 类 似 下 面 的 代码 。 


fieldl 
field2 another value 


some value 














我 们 会 用 RST 字段 列表 的 一 种 扩展 





部 分 的 元 素 。 我 们 会 添加 
些 字段 前 级 可 以 选择 。 


arg、argument、key 和 keywor 























:Param rank: Numeric rank 


:param suit: Suit of the c 








我 们 通常 用 param 











些 关 键 字 作为 前 绥 ， 
我 人 


(或 param 





式 来 编写 API 文档 。 
例如 param 或 者 

















标签 通 























我 























常 很 短 ， 根 据 需 


门 会 将 字段 名 扩展 为 一 个 包含 多 个 
七 YPe 。 前 级 之 后 是 参数 名 。 


] 可 以 选择 下 面 这 些 前 级 中 的 任何 一 个 : param、parameter、 
gd。 例如， 我 们 可 能 会 写 下 面 这 样 的 代码 。 





of the card 
ard 



































我 们 建议 不 要 在 Python 代码 的 文档 
这 些 前 级 可 以 被 用 于 为 






































Tl 


7 

















中 的 名 称 ， 确 
我 们 也 可 以 用 


:type rank: 


列 保 它们 是 匹配 的 。 























integer in the 





于 Python 很 灵活 ， 











大 



























































type 作为 前 绥 定 义 参数 类 型 。 


range 1-13. 














此 这 利 


FP 定 义 的 纪 


















































经 展示 了 这 种 样式 : Numeric rank of the card。 











对 了 























有 返回 值 的 函数 , 我 们 应 该 描述 结果 ， 可 以 用 



































我 们 也 可 以 正式 地 用 rtype 指出 返回 值 的 类 型 。 我 们 可 能 会 


:returns: 





:rtype: integer 


另外 , 我 们 应 该 也 包含 关于 这 个 函数 特有 的 异常 信息 。 有 4 个 别名 可 以 用 了 
能 会 编写 下 硬 














soft total for this card 











我 们 可 





lue not in range 
































raise、except 和 exception。 
:raises TypeError: rank va 
我 们 也 可 以 描述 类 的 属性 。 对 了 
下 面 这 样 的 代码 。 

















:ivar soft: 











节 可 能 不 是 必需 的 。 在 许多 情况 下 ， 参 数值 只 需 
简单 的 数字 :param somearg:， 可 以 包含 一 些 通 用 类 型 的 信息 作为 描述 。 我 们 在 前 面 的 例子 ! 





eter) 作为 位 置 参数 、key (或 keyword) 作为 关键 字 人 参数 。 
使 用 arg 或 argument ， 因 为 它们 与 Python 的 语法 类 别 不 匹配 。 
他 语言 的 shell 脚本 或 API 文档 。 


这 些 字段 列表 的 定义 会 被 统一 记录 到 一 个 缩 进 的 块 中 。Sphinx 工具 也 会 比较 文档 中 和 函数 参数 
































returns 或 者 return 字段 标签 汇 ， 
编写 下 面 这 样 的 代码 。 





这 样 的 代码 。 


Lg. dd) 





只 需要 是 
已 
总 返回 值 





























这 个 字段 : raises、 


这 种 情况 ， 可 以 用 var、ivar 或 者 cvar。 可 能 会 纺 





写 类 似 














soft points for this card; usually hard points, except for aces . 


:ivar hard: hard points for this card; usually the rank, except for face cards. 


我 们 应 该 用 ivar 表示 实例 变量 ， 用 cvar 表示 
没有 任何 不 同 。 








这 些 字段 列表 用 
法 。 

编号 类 和 方法 函数 的 文档 字符 串 
属性 和 方法 函数 。 
E 命 快 结束 时 还 需要 进行 垃圾 














些 字段 的 | 


18.5.2 











类 通常 会 包含 询 
对 象 、 改 变 状态 以 及 可 能 帮 
串 或 方法 函数 


的 文档 

















[多 元 素 、 
E 对 象 的 4 
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类 变 























为 类 、 类 方法 和 独立 的 函数 
































关 符 串 ， 








我 们 会 ) 





j 字 段 列表 技术 在 全 





Variable:、 


每 个 独立 的 方法 函 
写 带 有 描述 类 和 方法 函数 文档 





是 我 们 开始 编 


:Cvar 





导 备 文 





个 有 





























对 这 些 状态 改变 ! 








的 一 些 ( 








F 级 别 的 文档 


状态 的 类 的 API 可 
回收 。 我 
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量 。 但 是 ， 对 于 最 后 的 HTML 输出 而 言 ， 





档 字符 串 。 我 们 会 在 后 面 的 部 分 中 介绍 这 





能 相对 会 复杂 一 些 。 创 建 
门 可 能 想 在 类 的 文档 字符 














或 全 部 ) 进行 描 i 








述 。 



































局 的 类 文档 字符 串 ， 















































class Card: 





数 还 会 











> Ar 吕 


字符 品类 的 一 


variable: 和 :var variable: 字 段 列 


j 字 段 列 表 定 义 参 数 并 返回 























种 方法 。 


"""Definition of a numeric rank Playing card. 


Subclasses will define 


:ivar rank: Rank 
:ivar suit: Suit 
:ivar hard: 
:ivar soft: 

www 

def init ( 


self, rank, suit, 


"FaceCard" 


and 


Hard point total for a card 


"""Define the values for this card. 


:param rank: 
:param suit: 
:param hard: 
:param soft: 


ww 


"AceCard". 


Numeric rank in the range 1-13. 


Suit object 


(often a character from 


表 元 
每 个 方法 函数 抛 出 的 异常 和 返回 值 。 下面 


记录 类 变量 。 这 通常 会 专注 了 
素 。 


hard, soft=None ) : 





使 用 :ivat 












































Soft total; same as hard for all cards except Aces . 


' dra') 


Hard point total (or 10 for FaceCard or 1 for AceCard) 
The soft total for AceCard, otherwise defaults to hard. 



























































的 工 














就 可 以 格式 化 出 非常 美 





























一 个 方法 函数 参数 的 方法 级 


FE 常 让 人 反感 ， 因 为 它 在 语义 上 


self.rank= rank 
self.suit= suit 
self.hard= hard 
self.soft= soft if soft is not None else hard 
当 我 们 在 文档 字符 串 中 包含 这 种 RST 标记 时 ， 类 似 Sphinx 这 档 
观 的 HTML 输出 。 我 们 已 经 为 你 提供 了 实例 变量 类 级 别 的 文档 和 其 
别 文档 。 
当 与 help () 一 起 使 用 时 ，RST 是 可 见 的 。 这 样 的 做 法 不 是 
是 有 意义 的 并 且 不 会 产生 困惑 。 这 意味 着 我 们 可 能 需要 妊 


些 平衡 。 











E help () 文本 和 Sphinx 文档 ! 




















做 出 的 一 
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18.5.3 ”编写 困 数 文档 字符 串 


一 个 函数 文档 字符 串 可 以 用 字段 列表 格式 化 来 定义 参数 、 返 回 值 和 抛 出 的 异常 。 
含 了 文档 字符 串 的 示例 函数 。 


def card( rank, suit ) : 





























"""Create a "Card" instance from rank and suit. 

:Param rank: Numeric rank in the range 1-13. 

:param suit: Suit object (often a character from 'wY44 ') 
:returns: Card instance 


:raises TypeError: rank out of range. 


>>> import P3_c18 

SS Bo CL Card( 3 “YY™ 9) 
39 

wn 

if rank == 1: return AceCard( rank, suit, 1, 11 ) 

elif 2 <= rank < 11: return Card( rank, suit, rank ) 
elif 11 <= rank < 14: return FaceCard( rank, suit, 10 ) 
else: 


raise TypeError( 'rank out of range' ) 


下 面 是 一 个 包 
































这 个 函数 的 文档 字符 串 包含 参数 定义 、 返 回 值 和 抛 出 的 异常 。 有 4 个 单独 的 字段 列表 元 素 被 用 于 
























































标准 化 API。 我 们 也 已 经 包含 了 一 个 doctest 序列 。 当 我 们 在 Sphinx 中 为 这 个 模块 编写 文档 时 ,我 

















们 会 获得 一 个 非常 美观 的 HTML 输出 。 另外, 我们 可 以 用 aoctest 工具 来 确认 函数 与 简单 的 测试 用 





























例 匹配 。 


18.6 更 复杂 的 标记 技术 


还 有 一 些 标记 技术 可 以 让 文档 更 易 读 。 尤 其 是 ， 我 们 通常 希望 在 类 定义 中 创建 有 | 













































































我 们 可 能 也 希望 为 一 个 文档 中 的 节 和 主题 创建 交叉 引用 。 

在 纠 
下 3 种 引用 。 
@ 隐 式 的 节 标 题 引 用 : 可 以 用 'Some Heading' 引用 Some Heading 节 。 
所 有 docutils 能 够 识别 的 标题 。 


显 式 的 目标 引用 : 可 以 用 target 引用 _target 在 文档 中 的 位 置 。 

















[me 










































































































































































的 交叉 引用 。 








RST〔 就 是 没有 Sphinx) 中 ， 我 们 需要 提供 引用 了 文档 不 同 部 分 的 正确 URL， 我 们 有 以 


这 可 以 应 用 于 


























文档 内 引用 : 必须 创建 显 式 引用 节 标 题 的 完整 URL。docutils 会 将 节 标 题 翻译 为 小 写 ， 



































并 且 用 - 蔡 换 标点 符号 。 这 人 允许 我 们 在 外 部 的 文档 中 创建 指向 节 标 题 的 引 











Design <file:pbuild.py.html#design>' 。 





























当 我 们 使 用 Sphinx 时 ， 我 们 会 获得 更 多 文档 内 、 交 勾引 用 的 能 力 。 这 些 能 力 使 入 








写 包 含 大 量 细节 的 URL。 


] ， 类 似 这 样 : 
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18.7 用 Sphinx 生成 文档 


Sphinx 工具 能 够 生成 外 观 非常 好 看 的 多 格式 文档 。 通过 它 , 我 们 可 以 很 容易 地 将 来 自 于 源 代码 
的 文档 和 来 自 外 部 的 带 有 设计 笔记 、 需 求 或 者 背景 信息 的 文件 进行 合并 。 

Sphinx 可 以 在 http://sphinx-doc.org 上 找到 。 下 载 过 程 可 能 会 比较 复杂 ， 因 为 Sphinx 依赖 于 
另外 几 个 项 目 。 更 容易 的 做 法 可 能 是 首先 安装 setuptools, 这 里 面包 含 了 easy_install 脚本 ， 
然后 用 这 个 脚本 来 安装 Sphinx。 它 可 以 帮助 追踪 那些 必须 先 安装 的 、 项 目 额外 的 细节 。 

关于 setuptools 的 帮助 信息 ， 查 看 https://pypi.python.org/pypi/setuptools。 

一 些 开发 作者 倾向 于 使 用 pip 来 完成 这 种 类 型 的 安装 。 关 于 pip 的 信息 ， 可 参见 https:/ 
pypi.python.org/pypi/pip。 

Sphinx 的 教程 写 得 非常 好 。 可 以 从 这 些 教程 开始 学 习 ， 并 且 确 保 你 可 以 使 用 sphinx- quickstart 
和 sphinx-build 命令 。 通 常 ，make 程序 会 负责 运行 sphinx-buildq， 这 样 的 方式 简化 了 一 些 
Sphinx 命令 行 的 使 用 。 


18.7.1 使 用 Sphinx 的 快速 启动 


sphinx-quickstart 的 一 个 很 方便 的 功能 是 能 够 通过 一 个 交互 式 问答 会 话 填充 非常 复杂 的 
config.pyo 

下 面 是 这 种 会 话 的 一 部 分 ， 用 于 展示 这 个 会 话 看 起 来 是 怎样 的 , 我 们 标 出 了 一 
认 响 应 。 

对 于 更 复杂 的 项 目 ， 从 长 期 来 看 ， 将 文档 从 工作 代码 中 分 离 出 来 更 简单 。 在 全 局 的 项 目 树 中 创 
建 一 个 doc 目录 通常 是 一 个 好 主意 。 
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Ils 
| 
并 
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的 默 
































中 





Enter the root path for documentation. 
> Root path for the documentation [.]: doc 


对 于 非常 小 的 文档 ， 与 代码 和 HTML 交叉 没有 问题 。 对 于 更 大 的 文档 ， 尤 其 是 对 于 可 能 用 于 
生成 LaTex 和 PDF 的 文档 ， 保 持 这 些 文件 与 文档 的 HTML 版 本 的 独立 性 会 为 我 们 带 来 方便 。 




































































You have two options for placing the build directory for Sphinx 
output. 

Either, you use a directory " build" within the root path, or you 
separate 

"source" and "build" directories within the root patnh. 

> Separate source and build directories (y/N) [n]: y 


下 一 批 问题 指出 了 一 些 特定 的 加 载 项 ， 它 以 下 面 的 备注 开头 。 


Please indicate if you want to use one of the following Sphinx extensions : 


我 们 会 建议 使 用 一 些 对 常见 的 Python 开发 最 有 用 的 加 载 项 。 对 于 第 1 次 使 用 Sphinx 的 用 户 ， 
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这 些 加 载 项 足以 让 我 们 能 够 开始 使 用 Sphinx 并 且 生 成 优秀 的 文档 。 当 然 ， 对 于 特定 的 项 目 需求 和 

目标 会 需要 其 他 方案 。 

我 们 几乎 总 是 希望 包含 autodoc 功能 来 从 文档 注释 
程序 外 部 生成 文档 ， 我 们 可 能 需要 关闭 autodoc。 

> autodoc: automatically insert docstrings from modules (y/N) [n] : y 

如 果 我 们 有 doctest 的 示例 ， 可 以 让 Sphinx 运行 这 些 doctest 示例 。 对 于 小 项 目 ， 其 中 的 
大 部 分 测试 都 是 通过 doctest 来 完成 的 ， 这 种 做 法 非常 方便 。 对 于 更 大 的 项 目 ， 我 们 通常 会 有 包含 
doctest 的 单元 测试 脚本 。 通 过 Sphinx 执行 doctest 和 通过 正式 的 单元 测试 执行 都 是 很 好 的 选择 


























生成 文档 。 如 果 我 们 用 Sphinx 在 Python 








































































































> doctest: automatically test code snippets in doctest blocks (y/N) 
[n] : y 


一 个 成 熟 的 开发 过 程 中 可 能 有 许多 紧密 关联 的 项 目 ， 这 可 能 包括 多 个 相关 的 Sphinx 文档 目录 。 


> intersphinx: link between Sphinx documentation of different projects 
(y/N) [n]: 


toqdo 扩展 允许 我 们 在 文档 注释 中 包含 一 个 . .toqdo: :指令 。 然后， 可 以 在 文档 中 官方 的 to-do 
















































































列表 中 添加 一 个 特殊 的 . .todolist: :指令 。 
> todo: write "todo" entries that can be shown or hidden on build 
(Y/N) [n]: 


履 盖 率 报告 可 以 作为 质量 保证 指标 。 
> coverage: checks for documentation coverage (y/N) [nj] : 
对 于 包含 很 多 数学 函数 的 项 目 , 使 用 LaTex 工具 集 让 我 们 可 以 将 数学 函数 排版 为 美观 的 图 片 并 


包含 在 HTML 中 。 它 也 会 在 LaTex 的 输出 中 保留 原始 的 数学 函数 。MathJax 是 一 个 基于 网 页 的 
JavaScript 库 ， 我 们 也 可 以 用 下 面 的 方式 来 使 用 它 。 


> pngmath: include math, rendered as PNG images (y/N) [nl]: Y 
> mathjax: include math, rendered in the browser by MathJax (y/N) [n]: 
































































































































对 于 非常 复杂 的 项 目 ， 我 们 可 能 需要 生成 不 同 的 文档 。 








> ifconfig: conditional inclusion of content based on config values 
(Y/N) [n]: 

















大 部 分 应 用 程序 的 文档 都 会 描述 API。 我 们 应 该 包含 autoqoc 混合 viewcode 功能 ,viewcode 
选项 允许 读者 查看 代码 ， 这 样 他 们 就 可 以 了 解 详 细 的 实现 细节 。 

> viewcode: include links to the source code of documented Python 

objects (y/N) [nl]: y 

autodoc 和 doctest 功能 意味 着 我 们 可 以 专注 于 在 代码 中 编写 文档 注释 ， 只 需要 编写 非常 少 
的 Sphinx 文档 文件 来 提取 文档 注释 信息 。 对 于 一 些 开发 者 而 言 ， 能 够 专注 代码 减少 了 与 编写 文档 
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相关 的 念 惧 成 分 。 


18.7.2 ”编写 Sphinx 文档 

软件 开发 的 项 目 中 有 两 个 通用 的 起 点 。 

@ ”创建 一 些 起 始 文档 ， 并 且 这 些 文档 要 保留 下 来 。 

@ 无 ， 从 零 开始 。 
当 项 目 以 一 些 遗 留 的 文档 开始 时 ， 这 些 文档 可 能 包含 需求 、 用 户 故事 或 者 架构 笔记 。 它 可 能 也 
包括 组 织 政治 的 笔记 、 过 期 的 预算 和 进度 表 ， 还 有 其 他 一 些 和 技术 无 关 的 材料 。 

在 理想 状况 下 ， 这 些 起 始 文档 已 经 是 文本 文件 了 。 如 果 不 是 的 话 ， 它 们 可 能 是 基于 可 以 被 保存 
为 文本 的 某 些 文字 处 理 格式 。 当 我 们 有 面向 文本 的 起 始 文档 后 ， 添 加 RST 标记 来 向 我 们 展示 大 纲 
结构 并 且 将 这 些 文本 文件 组 织 成 一 个 简单 的 目录 结构 就 变 得 相对 简单 了 。 

没有 理由 将 内 容 保留 为 文字 处 理 文档 。 一 且 它 作为 软件 开发 项 目的 技术 文档 的 一 部 分 , RST 就 
可 以 允许 更 灵活 地 使 用 初始 信息 。 

种 会 有 困难 的 情况 是 ， 初 始 文档 是 用 Keynote、PowerPoint 或 者 一 个 类 似 的 工具 创建 的 一 套 约 灯 

片 。 将 这 些 文件 转换 成 以 文本 为 中 心 的 RST 很 困难 ， 因 为 图 表 和 图 片 是 幻灯 片 中 最 主要 的 内 容 。 在 这 
些 情况 下 ， 我 们 有 时 候 最 好 能 够 将 演示 文本 导出 为 一 个 HTML 文档 ， 然 后 将 它 保 存在 Sphinx 的 
doc/source/_static 目录 下 。 这 人 允许 我 们 可 以 通过 简单 的 RST 链接 将 原始 的 材料 集成 进 Sphinx 中 ， 
这 种 链接 通常 以 下 面 的 形式 呈现 : ' Inception <_static/inception doc/index.html>' 。 

当 使 用 交互 式 的、 基于 网 页 的 工具 来 管理 项 目 或 者 用 户 故 事 时 ， 起 始 和 背景 文档 需要 通过 简单 的 URL 
引用 来 处 理 ， 这 种 引用 的 形式 是 : 'Background <http://someservice/path/to/page.html>' 。 

通常 以 一 个 包含 一 些 占 位 符 的 轮廓 作为 书写 文档 的 开始 是 最 容易 的 ， 因 为 文档 的 内 容 会 随 着 软 
件 开发 的 进行 逐渐 增加 。 一 种 基于 4+1 视图 架构 的 结构 可 能 会 对 我 们 有 帮助 。 起 始 文档 通常 作为 场 
景 或 者 4+1 视图 中 用 户 故 事 的 一 部 分 。 有 时 候 ， 起 始 文档 会 作为 开发 或 者 物理 部 署 的 一 部 分 。 
更 多 关于 4+1 架构 的 信息 ， 可 以 参考 下 面 的 页 面 。 
http://en.wikipedia.org/wiki/4%2B1 architectural view model 

我 们 可 以 在 index .ntml 根 下 创建 5 个 顶层 的 文档 : user_stories、 logical、 process、 
implementation 和 physical。 每 个 都 必须 包含 一 个 RST 标题 , 但 是 在 文件 中 不 需要 任何 其 他 文本 。 

然后 我 们 可 以 更 新 Sphinx 的 index.rst 文件 默认 生成 的 . . toctree: :目录 。 
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. Mastering OO Python documentation master file, created by 
sphinx-quickstart on Fri Jan 31 09:21:55 2014. 
You can adapt this file completely to your liking, but it should at least 
contain the root 'toctree' directive. 


Welcome to Mastering OO Python's documentation! 








424 第 18 章 质量 和 文档 





Contents: 


COCtree:.: 
:maxdepth: 2 


user stories 
logical 
process 
implementation 
physical 


Indices and tables 








* :ref:'genindex' 
* :ref:'modindex' 


* GE search 
旦 我 们 有 了 顶层 的 结构 ， 就 可 以 用 make 命令 创建 文档 。 
make doctest html 


这 行 命令 会 运行 我 们 的 测试 用 例 ， 如 果 所 有 的 测试 通过 ， 它 会 创建 HTML 文档 。 


18.7.3 ”在 文档 中 加 入 4+1 视图 


随 着 开发 的 进行 ，4+1 视图 可 以 被 用 于 组 织 不 断 增加 的 细节 。 这 种 技术 通常 用 在 文档 注释 外 部 
的 信息 中 。 
我 们 用 user_stories .rst 文档 来 收集 用 户 故 事 、 需 求 和 其 他 高 层 的 背景 注释 。 如 果 用 户 故 
事变 得 越 来 越 复杂 ， 这 个 文档 会 逐渐 演变 为 一 个 目录 树 。 
我 们 用 logical .rst 文档 来 收集 初始 面向 对 象 设计 的 类 、 模块 和 包 。 这 应 该 作为 我 们 设计 思 
路 的 起 源 。 它 可 能 包含 蔡 代 方案 、 笔 记 、 数 学 背景 、 正 确 性 证 明和 风 辑 软件 设计 的 图 表 。 对 于 设计 
清晰 的 相对 简单 的 项 目 ， 这 个 文件 可 能 会 保持 为 空 。 对 于 复杂 的 项 目 ， 这 个 文件 可 能 会 描述 一 些 复 
杂 的 分 析 和 设计 ， 这 些 信息 会 作为 实现 的 背景 或 理 
最 后 的 面向 对 象 设计 是 implementation.rst 文件 中 的 Python 模块 和 类 。 我 们 会 介绍 多 一 些 
关于 这 个 文件 的 细节 ， 因 为 这 会 成 为 我 们 的 API 文档 。 这 部 分 将 直接 基于 Python 代码 和 RST 标记 的 
文档 字符 串 。 
process.rst 文档 可 以 收集 关于 动态 性 、 运 行 时 行为 的 信息 。 这 些 信 息 包括 了 一 些 主题 ， 例 
如 并 发 性 、 分 布 式 和 集成 。 它 也 有 可 能 包括 关于 性 能 和 可 扩展 性 。 网 络 设计 和 协议 的 使 用 也 有 可 能 
在 该 文档 中 描述 。 
对 于 更 小 的 应 用 程序 ， 哪 些 材料 应 该 保存 在 process 文档 中 不 是 非常 清晰 。 这 个 文档 可 能 会 与 
逻辑 设计 和 全 局 的 架构 信息 重合 。 当 有 疑问 时 ,我 们 必须 力求 基于 受众 对 于 信息 的 需求 来 明确 哪些 
信息 是 必要 的 。 对 于 一 些 用 户 而 言 ， 许 多 的 小 文档 是 很 有 帮助 的 。 对 于 其 他 的 一 些 用 户 ， 他 们 更 倾 
向 于 一 个 大 型 文档 。 







































































































































































































































































































































































































































































































































































件 中: 环境 变量 、 


息 。 这 可 能 也 包含 配置 信息 ,例如 服务 嚣 名称、 
司 里 ， 管 理 员 可 能 会 觉得 其 














physical.rst 文件 是 我 们 记录 部 署 旨 




















配置 文件 格式 细节 、 可 ) 













































































18.7.4 


implementation.rst 文档 。 


间 的 关系 。 在 本 例 中 ， 我 们 在 父 标题 上 用 了 " 
目录 下 的 文档 的 显 式 引 用 
文档 的 index.html 文件 间 创建 了 一 个 复杂 的 RST 链接 。 
提取 文档 字符 串 。 


词 inception document 和 实例 
， 我 们 用 Sphinx 的 .. automodule: :指令 从 两 个 模块 
我 们 为 automodule 指令 提供 了 3 个 参数 。 


:members :: 这 个 指令 包含 模块 的 所 有 成 员 。 我 们 可 以 列 出 显 式 的 成 员 类 和 函数 ， 而 不 是 














编号 实现 文档 


implementation.rst 文档 可 以 用 























Implementation 








Here's a reference to the 


index.html>"' 


The p3 cl18 module 





. automodule:: p3 cl18 
:members: 
:undoc-members: 
:special-members: 


The simulation model module 





. automodule:: simulation model 
:members: 
:uNndoc-members: 


:special-members: 














个 、 














我 们 用 了 两 种 RST 标题 : 有 























我 们 为 你 提供 了 一 个 复制 到 static 



































在 两 个 副标题 ' 























多 
列 出 所 有 的 成 员 。 
@ :undoc-members:: 这 个 指令 包 
这 个 指令 很 方便 ， 我 们 会 获得 一 些 
@ :special-members:: 这 个 指令 


今 
全 
三 

最 


节 的 地 方 。 我 们 会 将 配置 小 名 
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日 节 的 描述 保存 在 这 个 文 








的 日 











志 记 录 器 名 称 以 及 其 
IP 地 址 、 账 号 名 、 目 录 名 和 相关 的 注释 。 























对 











有 些 细节 不 适合 作为 通用 的 软件 文档 。 








也 管理 与 技术 支持 所 需要 的 信 


在 一 些 公 








automodule 创建 文档 。 下 面 是 如 何 开始 编写 一 份 





"inception document < static/inception doc/ 





缺少 适当 文档 注释 的 成 员 。 
基本 的 API 信息 。 
包含 了 默认 情况 下 没有 包含 在 Sphinx 文档 ! 

















inception doc 








独 的 顶层 标题 和 两 个 副标题 。RST 推断 出 了 父 标题 和 子 标题 
---" 作 为 下 划 线 ， 在 子 标题 上 用 了 "---" 作 为 下 划 线 。 
,我 们 在 单 












































本 











在 开发 的 开始 阶段 ， 使 用 


于 



























































的 特殊 方 
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法 名 成 员 。 











这 个 文档 会 提供 








和 :special-members :指令 ， 我 1 





我 们 的 implem 
用 作为 已 完成 的 模块 。 

















. automodule: :指令 的 组 织 方式 可 以 为 我 们 
省 概 述 。 我 们 花 了 一 些 时 














相对 完整 的 视 医 
门 会 获得 一 个 更 小 、 信 息 更 
entation.rst 文档 可 以 随 着 项 


闻 组 织 文 档 


区 




















，1 


























有 了 时 过 于 完整 ， 如 果 

















口 














作 的 , 这 比 大 量 的 空话 更 有 价值 。 关键 在 于 不 要 编写 大 量 记 倒 性 


























18.7.5 ”用 Sphinx 创建 交叉 引用 


Sphinx 扩展 了 RST 





现 的 方式 , 这 样 

















集中 的 文档 。 





目的 演变 而 





个 的 组 





的 文本 ,并 为 其 他 的 天 





我 们 又 不 使 用 undoc _ members : 


变化 。 我 们 会 添加 automodule 引 





提供 一 份 包含 复杂 的 模块 或 包 的 集合 的 蓝图 或 
忆 就 可 以 向 我 们 展示 软 





牛 之 间 是 如 何 协 








Ff 发 者 提供 引导 


-可 oo 



































可 以 使 用 的 交叉 引 ) 














Python 代码 的 功能 。 
量 额 外 的 角色 都 是 来 








这 些 交 叉 引 j 
自 于 Sphinx 。 




















我 们 有 下 面 几 种 可 | 
:py:mod:'some_module' 语 法 会 生成 指向 这 个 模块 或 者 包 的 定义 的 链接 。 
E 成 指向 函数 定义 的 链接 ， 可 以 使 用 带 有 











的 交叉 续 





:py:func:'some function' 语 





用 角色 。 














法 会 9 


技术。 最 重要 的 交叉 














| 
WT 











module.function 或 package.module.function 的 全 名 。 


py:data:: variable} 


全 名 。 





:py:meth:'class.method' 语 法 会 链接 到 一 个 方法 


:py:attr:'class.attribute' 语 法 会 链接 到 定义 在 


指令 中 的 属 











性 。 











已 人 
间 念 : 











:py:obj:'some object' 语 法 可 以 














如 果 





Ne 








每 个 
过 在 每 个 
下 面 


def cardl( 
"""Create 





















































我 在 文档 尘 


FE 释 ! 




















使 用 "someClass"， 








:py:class:'SomeClass' 
色 都 带 有 :py : 前 绥 ， 
色 上 使 用 :py : 前 绥 ， 
的 文档 注释 包含 指向 其 他 类 和 异常 的 显 式 的 交叉 引用 。 


a 


:py:class:'Card'"' 





， 会 获得 一 个 指向 

















:py:class:'some class' 语 法 会 链接 到 类 定义 。 





























的 定义 。 








我 


类 定义 的 正确 











A 


:py:exc:'exception' 语 法 会 链接 到 一 个 定义 好 的 异常 。 
创建 一 个 指向 对 象 的 
门 会 得 到 用 等 宽 字 体 显 示 的 类 名 。 如 果 我 们 使 








通用 链接 。 









































引用 ， 





因为 Sphinx 可 
Sphinx 可 以 合 




















以 





来 编 




















写 关 了 











理 } 





也 提 供 语法 











rank, suit ): 

















:Param rank: Numeric rank in the range 1-13. 





4 
同学 六 不 。 


充 和 


instance from rank and suit. 


.. py:attribute:: 


能 力 是 可 以 直接 引用 特定 的 
会 用 :role: 'text ' 语 法 调用 内 联 的 RST 标记 。 在 本 例 中 ， 大 




















:py:data:'variable' 和 :py:const:'variable' 语 法 会 生成 指向 定义 在 .. 
的 模块 变量 的 链接 。 常 量 只 是 
可 以 使 


个 不 应 该 被 修改 的 变量 。 
类 似 mogdule .class 这 样 的 





name 


























这 个 引用 通常 对 我 们 更 有 帮助 。 
Python 之 外 的 其 他 语言 的 文档 。 通 























一 性 ，i 
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:param suit: Suit object (often a character from 'wY44 ') 
:returns: :py:class:'Card' instance 

:raises :py:exc:'TypeError': rank out of range. 

PG, 














吉 用 :py:class:'Card' 而 不 是 "card", 我 们 可 以 在 这 个 注释 块 和 card 类 的 定义 间 创 建 








显 式 的 链接 。 类 似 地 ， 我 们 使 用 :py :exc:'TypeError' 来 创建 一 个 指向 这 个 异常 定义 的 显 式 链接 。 
另外 ， 
ref :'some-name' 来 引用 这 个 标签 。some-name 这 个 名 称 必 须 是 唯一 的 。 为 了 确保 这 种 









































我 们 可 以 通过 . ._some-name : : 定义 一 个 链接 目标 ， 并 且 在 Sphinx 文档 树 的 任意 文档 






















































































通常 定义 某 种 层次 结构 会 是 一 个 好 方法 ， 这 样 一 来 名 称 就 是 从 文档 到 节 到 主题 的 某 种 路 径 。 











18.7.6 将 Sphinx 文件 重 构 为 目录 


一 个 


件 帅 





的 情 














开发 竹 








对 于 更 大 的 项 目 ， 我 们 需要 使 用 目录 而 不 是 简单 的 文件 。 在 本 例 中 ， 我 们 将 使 用 下 面 的 步骤 
个 文件 重 构 为 目录 。 















































[9 














1. 添加 目录 : implementataion。 


2. 将 原始 的 Implementation.rst 文件 移动 到 implementation/index.rst。 
3. 修改 原始 的 index rst 文件 。 转 换 . .toctree: :指令 引用 implementation/ index 














而 不 是 implementation。 





























然后 ， 我 们 可 以 开始 在 implementation 目录 下 工作 , 在 implementation/index.rst 文 
使 用 . . toctree: :指令 包含 本 目录 中 的 其 他 文件 。 























况 。 























当 我 们 的 文档 被 分 为 包含 简单 文本 文件 的 简单 目录 时 ,我 们 可 以 修改 小 的 、 集 中 的 文件 。 每 个 
都 可 以 做 出 一 些 重要 贡献 而 不 会 在 试图 修改 一 个 大 型 的 文字 处 理 文档 时 遇 到 文件 共享 冲突 
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软件 


第 15 章 “ 可 测试 性 的 设计 ”中 介绍 的 ， 不 能 使 用 不 可 信任 的 代码 。 在 本 章 中 ， 建 议 将 测试 作为 建 




















质量 的 一 个 重要 组 成 部 分 来 自 指出 产品 不 仅仅 是 针对 编译 器 或 解释 器 的 代码 。 正 如 我 们 在 





















































立信 任 的 基本 元 素 。 我 们 希望 更 泛 化 一 些 。 除 了 具体 的 测试 之 外 ， 还 有 其 他 一 些 质量 属性 让 代码 可 


用 。 









































可 靠 ; 


在 下 


由 
污 














生 就 是 其 中 一 个 属性 。 








且 的 情况 下， 我 们 会 信任 代码 。 








理解 用 例 。 
理解 数据 模型 和 处 理 模 型 。 





























理解 测试 用 例 。 


















































门 介绍 更 多 技术 质量 属性 时 ， 会 发 现 这 些 都 是 关于 理解 的 。 例 如 ， 调 试 似 乎 意味 着 我 
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们 可 以 确保 理解 应 用 程序 是 如 何 工 作 的 。 审 计 似乎 也 意味 着 ， 为 了 证 明 我 们 对 处 理 过 程 的 理解 















































是 正确 


























的 ， 我 们 可 以 通过 查看 具体 的 示例 来 表明 它们 在 按照 我 们 的 预期 工作 。 





















































文档 建立 了 信任 。 更 多 关于 软件 质量 的 信息 ， 可 以 从 阅读 这 个 页 面 开始 : http://en.wikipedia. org/wiki/ 


Software quality 。 








非常 











有 很 多 关于 软件 质量 的 知识 需要 学 习 ， 它 是 一 个 很 大 的 主题 ， 这 里 介绍 的 只 是 大 














小 的 一 个 方面 。 





18.9 ”大 纲 式 编程 


分 离 文 档 和 代码 


言 相 对 
试图 减 











档 可 以 






























































的 想法 可 以 看 成 是 人 为 分 离 。 历 史上 , 我 们 在 代码 外 部 编写 文档 是 因为 编程 语 






































来 说 不 透明 并 








i 

















在 这 样 的 做 法 上 更 进一步 ， 它 在 包 、 模 块 、 类 和 函数 




















局 重 于 高 效 的 编译 ， 编 程 语言 本 身 并 不 注重 清晰 地 阐述 。 人 们 用 了 很 多 技术 
少 工作 代码 和 关于 代码 的 文档 间 的 距离 。 例 如 ， 














巾 入 更 完善 的 注释 一 直 是 传统 做 法 。Python 
































软件 开发 中 的 大 纲 


























语言 作 


大 岗 式 编程 鼓励 更 深入 地 形 


让 一 个 


要 好 处 是 让 更 深层 次 的 设计 和 用 例 信息 能 够 以 一 种 比 简单 的 Unicode 文本 更 易 读 的 方式 来 表达 。 














包含 了 正式 的 文档 注释 。 











式 编 程 方 法 由 Don Knuth 首先 提出 。 这 种 编程 方式 的 想法 是 一 个 单一 的 源 文 
生成 高 效 的 代码 和 美观 的 文档 。 对 于 面向 机 器 的 汇编 语言 和 类 似 于 C 的 语言 ， 从 源 代 码 的 语 
言 〈 强 调 翻译 的 标记 ) 换 到 一 个 强调 清晰 闻 释 的 文档 还 有 一 个 额外 的 好 处 。 另 外 ， 一 些 大 纲 式 编程 


















































为 高 层 编程 语言 ， 这 种 做 法 可 能 适合 C 或 者 Pascal， 但 是 对 于 Python 没有 直接 的 帮助 。 





























Python 程序 容易 


理解 不 需要 复杂 的 大 纲 式 编程 。 















































E 解 代码 。 在 Python 的 例子 中 ， 源 代码 一 开始 的 可 读 性 非常 好 ， 可 以 














mo 


事实 上 ， 对 于 Python 而 言 ， 大 纲 式 编程 的 主 

















更 多 关于 这 方面 的 信息 , 可 以 查看 http://en.wikipedia.org/wiki/Software_quality 和 http:/xml. coverpages. 
org/xmlLitProg.html。DonaldKnuth 写 的 Literate Programming 中 有 关于 这 个 主题 的 完整 描述 。 


18.9.1 大 纲 式 编程 用 例 


Ik 








创建 大 纲 式 程序 














时 ， 有 两 个 基本 目标 。 





























一 个 工作 程序 : 这 是 从 源 文 档 中 提取 的 代码 ， 这 些 代 码 是 为 编译 器 或 者 解释 器 准备 的 。 
易 读 的 文档 : 这 是 为 演示 提供 的 阐释 、 代 码 和 其 他 任何 对 我 们 有 帮助 的 标记 。 这 个 文档 是 








创建 一 个 PDF 








随时 可 以 查看 的 HTML。 或 者 它 基于 RST, 然后 我 们 可 以 用 aocutils 的 rst2ntml .py 


将 它 转换 为 HIML 格式 。 或 者 它 基 于 LaTex， 









































文档 。 










































































然后 我 们 通过 一 个 LaTex 处 理 器 来 执行 它 并 
































工作 程序 目标 意味 着 我 们 的 大 纲 式 编程 文档 将 会 覆盖 所 有 的 源 代 码 文 件 。 尽 管 这 看 起 来 有 点 吓 
人 ， 但 是 我 们 必须 记 住 组 织 良 好 的 代码 片段 不 需要 太 多 复杂 的 手动 工作 ， 在 Python 中 ， 代 码 本 身 就 可 


以 很 清 
































晰 并 且 是 有 意义 





的 。 





易 读 的 文档 目标 意 


味 着 我 们 希望 生成 包含 一 些 其 人 











码 是 以 





等 宽 字 体 表示 ， 


变种 ， 例 如 粗 体 或 者 斜 

















晶 是 这 种 字体 并 不 是 最 易 读 的 。 









































也 样式 而 不 只 是 字体 的 文档 。 尽 管 大 多 数 的 代 
基本 的 Unicode 字符 集 没有 包括 有 用 的 字体 
























































体 。 这 些 额外 的 显示 细节 《字体 变更 、 字 号 变更 和 样式 变更 ) 必须 保持 演变 
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来 让 文档 更 加 可 读 。 











在 许多 情况 下 ， 我 们 的 PythonIDE 会 给 Python 的 代码 加 上 颜色 ， 这 对 我 们 也 是 有 帮助 的 。 书 
面 交 流 的 历史 包括 很 多 可 以 增强 可 读 性 的 功能 ， 它 们 中 没 


Python 源 代码 中 。 


另外 ， 一 份 文档 应 该 
明确 的 组 织 方法 ， 因 为 它 会 限 种 


















































有 哪个 可 以 用 在 只 使 用 一 种 字体 的 简单 

















围绕 问题 和 解决 方案 来 组 织 。 在 许多 编程 语言 


























， 代 码 自身 无 法 遵循 一 种 









































我 们 的 两 个 目标 可 以 归结 为 两 个 技术 用 例 。 
@ 将 一 份 原始 的 文本 转换 为 代码 。 

@ 将 一 份 原始 的 代码 文本 转换 为 最 终 文 档 。 
我 们 可 以 在 菜 种 程度 上 









































一 些 深刻 的 方法 重 构 这 两 个 





























| 于 语法 的 技术 考虑 和 编译 顺序 。 








j 例 。 例 如 ， 我 们 可 以 从 代码 中 提取 文档 。 








这 是 pygoc 模块 的 功能 ， 但 是 这 个 模块 无 法 正确 地 处 理 标 记 。 























我 们 可 以 将 代码 和 最 终 文档 这 两 个 版 本 编写 为 同型 的 。 




















可 以 通过 文档 注释 和 # 注 释 完 4 

















18.9.2 ”使 用 大 纲 式 编 程 工具 


有 许多 大 纲 式 编程 (Literate Programming，LP) ] 








这 是 PyList 项 目 采 取 的 方法 。 最 终 文档 








嵌入 Python 代码 中 。 代码 可 以 通过 : :文本 块 完全 乱入 RST 文档 中 。 

















素 也 不 同 ， 这 些 要 素 是 用 了 

















[ 具 可 以 使 用 。 根 据 工 具 的 不 同 ， 基 本 的 要 

















将 解释 从 代码 中 分 离 的 高 层 标记 语言 。 








我 们 编写 的 源 文 件 将 包含 下 面 3 种 元 素 。 




















e@ 作为 解释 和 描述 的 














@ 代码。 





标记 文本 。 











@ 用 于 从 代码 





















































标记 。 


于 XML 的 灵活 1 
基于 原始 的 Web (和 章 


分 离 
性 ， 它 可 以 作为 大 纲 式 编程 的 高 层 标 记 。 但 是 ， 编 写 XML 不 简单 。 有 一 些 工 
有 的 CWeb) 的 工具 可 以 处 理 类 似 LaTex 的 标记 。 有 一 些 工具 将 RST 作为 高 层 








文本 《〈 带 有 标记 ) 的 高 层 标记 。 
























































































































































然后 ， 选 择 一 个 工具 的 基本 步骤 是 仔细 研究 这 个 工具 所 使 用 的 高 层 标 记 。 如 果 我 们 发 现 标 记 很 

















容易 书写 ， 就 可 以 使 | 











j 它 来 











Python 








@ 大纲 式 编程 的 














这 





生成 源 文档 。 














证 我 们 可 以 创建 两 层 文档 。 











带 来 了 一 种 有 趣 的 挑战 。 由 于 我 们 有 了 基于 RST 的 工具 ， 例 如 Sphinx， 我 们 可 以 创建 
非常 大 纲 式 的 文档 注释 。 











@ 搓 入 文档 注 和 和 























引用 和 API 文档 。 














的 、 不 断 进 化 的 大 纲 式 编程 方法 。 








注释 和 代码 以 外 的 背景 。 这 应 该 作为 通用 的 背景 材料 ， 而 不 是 只 关注 代码 本 身 。 
中 的 


这 为 我 们 带 来 了 一 个 愉快 上 





@ 首先， 我 们 可 以 通过 将 RST 标记 峰 入 文档 注释 中 作为 开始 ， 这 样 Sphinx 生成 的 文档 就 会 














拥有 很 好 的 外 观 并 


















































为 实现 方法 的 选择 提供 了 合 到 


的 解释 。 

















Walt 
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出 











@ 我 们 可 以 跳 过 信息 集中 的 文档 注释 ， 创 建 背景 文档 。 这 个 文档 可 能 会 包含 关于 设计 决策 、 























今 
架构 、 需 求 和 用 户 故 事 的 信息 。 尤 其 是 ， 不 属于 代码 的 非 功能 性 质量 需求 描述 。 




















@ 一 旦 我 们 开始 标准 化 这 个 高 层 的 设计 
会 规定 我 们 将 文档 和 代码 合并 到 一 个 和 
工具 提取 代码 并 生成 文档 ， 一 些 LP 工具 也 可 以 被 用 寺 






























































我 们 的 目标 是 创建 不 但 设计 合理 














的 方式 ， 包 括 提供 一 个 整洁 、 清 晰 














如 果 我 们 使 用 类 似 PyLit 这 检 


莫非 砷 提 提 捍 提 井 提 六 ## 非 大 
Combinations 


非 非 提 提 提 提 扩 挤 提 提 间 ## 莫 











. Contents:: 


Definition 








过 
































文档， 可 以 更 容易 地 使 用 LP 工具 。 然 后 ， 这 个 工 
的 全 局 文档 结构 中 的 方式 。 我 们 可 以 使 用 LP 






































~ 


























而 


























J 测试 套件 。 


运 






















































































For some deeper statistical calculations, 


we need the number of combinations of *n* things 
taken *k* at a time, :math:'\binom{n}{k}'. 


. math:: 


\binom{n}{k} = \dfrac{n!}{k! (n-k)!} 


The function will use an internal 


值得 信赖 的 软件 。 正 如 前 面 介绍 的 , 我 们 有 很 多 建立 信 
的 解释 来 说 明 为 什么 我 们 的 设计 是 合理 的 。 
的 工具 ， 可 能 会 创建 类 似 下 面 这 样 的 RST 文件 。 
"fact()" function because 


we don't need factorial anywhere else in the application. 


We'll rely on a simplistic factorial function without memoization. 


Test Case 


Here are two simple unit tests for this function provided 


as doctest examples. 


>>> from combo import combinations 


>>> combinations (4,2) 
6 
>>> combinations (8,4) 
70 


Implementation 








Here's the essential function definition, with docstring: 























~ 
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def combinations ( n, k ) : 
"""Compute :math:'\binom{n}{k}', the number of 
combinations of *n* things taken *k* at a time. 


:param n: integer size of population 
:Param k: groups within the population 
:returns: :math:'\binom{n} {k}" 


mnmnm 


An important consideration here is that someone hasn't confused 
the two argument values. 
assert k <= DT 


Here's the embedded factorial function. It's recursive. The Python 


stack limit is a limitation on the size of numbers we can use. 


def fact (a): 
if a == 0: return 1 
return a*fact (a-1) 


Here's the final calculation. Note that we're using integer division. 
Otherwise, we'd get an unexpected conversion to float. 


return fact (n)//( fact(k)*fact (n-k) ) 





这 是 完全 用 RST 标记 编写 的 文件 。 它 包含 一 些 解 释文 本 ， 一 些 正式 的 数学 表达 式 ， 甚 至 还 有 
一 些 测 试用 例 。 这 些 元 素 为 我 们 提供 了 额外 的 细节 来 文 持 相关 的 代码 块 。 考 虑 到 PyLit 的 工作 方式 ， 
我 们 将 文件 命名 为 combo .py.txt。 我 们 可 以 利用 这 个 文件 做 以 下 3 件 事情 。 


@ 可 以 用 PyLit 以 下 面 的 方式 从 这 个 文件 中 提取 代码 。 


python3.3 -m pylit combo.py.txt 




























































































这 行 命令 从 combo .py .txt 创建 combo .py。 这 是 一 个 可 以 直接 使 用 的 Python 模块 。 
@ 也 可 以 使 用 docutils 将 这 个 RST 格式 化 为 HTML 页 面 ， 这 个 HTML 页 面包 含 了 比 原始 的 
单字 体 文本 更 易 读 的 文档 和 代码 。 


rst2html .py combo.py.txt combo.py.html 















































这 行 命令 创建 了 可 以 查看 的 combo .py.html。docutils 会 使 用 mathajax 包 来 排版 文本 中 
数学 相关 的 部 分 ， 生 成 外 观 很 好 的 输出 。 


@ 另外， 还 可 以 用 PyLit 运行 doctest 并 且 确 认 这 个 程序 确实 在 正常 工作 。 
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Python3.3 -m pylit --Qqoctest combo.py.txt 





























这 行 命令 会 从 代码 中 提取 doctest 块 ， 并 且 通 过 doctest 工具 运行 它们 。 我 们 会 看 到 所 有 
测试 〈 一 个 导入 和 两 个 函数 计算 ， 共 计 3 个 ) 都 会 生成 所 预期 的 结果 。 
最 后 生成 的 网 页 看 起 来 可 能 类 似 下 面 的 截图 。 





















































Combinations 


CD BA + © file:///Users/slott/Dropbox/Packt/Code/combo.py.html 
DO 吕 ; AppleY News Facebook Twitter MyYahool Web Stuffv Googlev [Bullet N 
. . 
Combinations 
Contents 
。 Definition 
e TestCase 


。 Implementation 


Definition 


For some deeper statistical calculations, we need the number of combinations of n things 


taken k at a time, (9) s 
(= 
k Ra- 有 AI 月 ! 


The function will use an internal fact() function because we don't need factorial 
anywhere else in the application . 


Wellrely on asimplistic factorial function without memoization. 


Test Case 


























我 们 的 目标 是 创建 值得 相信 的 软件 。 一 份 整洁 、 清 晰 的 文档 阐述 为 什么 我 们 的 设计 是 合理 的 ， 
对 于 建立 这 种 信任 非常 重要 。 通 过 在 一 个 单一 的 源 文 本 中 并 排 地 编写 软件 和 文档 ， 可 以 确保 文档 是 
完整 的 并 且 为 设计 决策 和 全 局 的 软件 质量 提供 一 份 合理 的 审核 。 一 个 简单 的 工具 就 可 以 将 工作 代码 
和 文档 从 一 个 单一 的 文件 中 提取 出 来 ， 这 样 我 们 就 可 以 很 容易 地 创建 软件 和 文档 。 
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18. 10 ”总 结 


























我 们 介绍 了 用 下 面 4 种 方式 创建 可 用 的 文档 。 

@ 可 以 在 文档 注释 包括 一 些 软件 的 信息 。 

可 以 用 pydoc 从 软件 中 提取 API 引用 信息 。 
可 以 用 Sphinx 创建 更 复杂 、 更 详细 的 文档 。 
同样 地 ， 可 以 用 大 纲 式 编程 工具 创建 更 深入 、 更 有 意义 的 文档 。 




























































































18.10 总结 433 


设计 要 素 和 折 中 方案 


我 们 应 该 将 文档 注释 当 作 与 其 他 Python 源 代码 一 样 重要 。 它 确保 了 help () 函数 和 pydoc 可 
以 正常 工作 。 和 单元 测试 用 例 一 样 ， 文 档 注释 应 该 被 看 作 软 件 的 必需 组 成 部 分 。 

Sphinx 创建 的 文档 可 能 具有 非常 好 的 外 观 ， 它 将 让 我 们 可 以 并 行 地 编写 文档 与 代码 。 我 们 的 
目标 一 直 是 与 其 他 的 Python 特性 无 颖 集成。 用 Sphinx 会 为 文档 的 获取 和 创建 引入 一 个 额外 的 上 
录 结 构 。 

随 着 我 们 设计 不 同 的 类 ， 如何 描述 设计 的 问题 几乎 会 变 得 和 最 后 获得 设计 本 身 一 样 重 
软件 无 法 快速 清晰 地 解释 ， 它 通常 会 被 视 为 不 可 信任 。 

花 一 些 时 间 编 写 一 份 说 明文 档 可 能 会 发 现 一 些 隐 藏 的 复杂 
下 ， 我 们 可 能 不 应 该 重 构 一 个 设计 来 修正 漏洞 或 者 提升 性 能 ， 
可 描述 性 是 具有 巨大 价值 的 质量 因素 。 
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要 。 如 果 



















































































童 





性 或 者 不 合 常规 的 行为 。 在 这 些 情 ; 
更 应 该 做 的 是 让 软件 变 得 更 容易 描述 ， 













































































异步 社区 的 来 历 

异步 社区 (www.epubit.com.cn) 是 人 民 邮 电 
出 版 社 旗下 IT 专业 图 书 旗 舰 社区 ， 于 2015 年 8 
月 上 线 运 营 。 

异步 社区 依托 于 人 民 邮 电 出 版 社 20 余年 的 
IT 专业 优质 出 版 资源 和 编辑 策划 团队 ， 打 造 传统 
出 版 与 电子 出 版 和 自 出 版 结合 、 纸 质 书 与 电子 书 
结合 、 传 统 印 刷 与 POD 按 需 印 刷 结合 的 出 版 平台 ， 
提供 最 新 技术 资讯 ， 为 作者 和 读者 打造 交流 互动 
的 平台 。 








社区 里 都 有 什么 ? 


购买 图 书 














器 千 步 什 区 
人 民 邮 电 出 版 社 


| | www.epubit.com.cn 








我 们 出 版 的 图 书 涵盖 主流 IT 技术 ， 在 编程 语言 、Web 技术 、 数 据 科学 等 领域 有 众多 经 典 畅销 图 书 。 
社区 现 已 上 线 图 书 1000 余 种 ， 电 子 书 400 多 种 ， 部 分 新 书 实现 纸 书 、 电 子 书 同步 出 版 。 我 们 还 会 定期 故 





布 新 书 书 讯 。 

















下 载 资 源 


社区 内 提供 随 书 附 赠 的 资源 ， 如 书 中 的 案例 或 程序 源 代码 。 
另外 ， 社 区 还 提供 了 大 量 的 免费 电子 书 ， 只 要 注册 成 为 社区 用 户 就 可 以 免费 下 载 。 








与 作 译 者 互动 











很 多 图 书 的 作 译 者 已 经 入 驻 社区 ， 您 可 以 关注 他 们 ， 咨 询 技术 问题 ， 可 以 阅读 不 断 更 新 的 技术 文章 ， 听 
作 译 者 和 编辑 畅 聊 好 书 背后 有 趣 的 故事 ;还 可 以 参与 社区 的 作者 访谈 栏目 ， 向 您 关注 的 作者 提出 采访 题目 。 


灵活 优惠 的 购书 


您 可 以 方便 地 下 单 购买 纸 质 图 书 或 电子 图 书 ， 纸 质 图 书 直接 从 人 民 邮 电 出 版 社 书 库 发 货 ， 电 子 书 提供 


多 种 阅读 格式 。 


对 于 重 磅 新 书 ， 社 区 提供 预 售 和 新 书 首发 服务 ， 
用 户 帐户 中 的 积分 可 以 用 于 购书 优惠 。100 积分 =1 元 ， 购 买 图 书 时 ， 在 。 


入 可 使 用 的 积分 数值 ， 即 可 扣 减 相应 金额 。 


用 户 可 以 第 一 时 间 买 到 心仪 的 新 书 。 


IE ED 


特别 优惠 


购买 本 书 的 读者 专 享 异 步 社 区 购书 优惠 券 。 


使 用 方法 : 注册 成 为 社区 用 户 ， 在 下 单 购书 时 输入 57AWG ， 然 后 点 击 “ 使 
用 优惠 码 ”， 即 可 享受 电子 书 8 折 优惠 〈 本 优惠 券 只 可 使 用 一 次 )。 








纸 电 图 书 组 合 购买 
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社区 独家 提供 纸 质 图 书 和 电子 书 组 合 购买 
方式 ， 价 格 优惠 ， 一 次 购买 ， 多 种 阅读 选择 。 





社区 里 还 可 以 做 什么 ? 


提交 勘 疾 


您 可 以 在 图 书页 面 下 方 提交 勘误 ， 每 条 勘 
误 被 确认 后 可 以 获得 100 积分 。 热 心 勘误 的 读 








软 技能 : 代码 之 外 的 生存 指南 
[ 鸭 ] 约 坦 Z. 森 梅 共 ( John Z. Sonmez ) (作者 ) 王 小 刚 ( 译 者 ) ” 杨 海 玲 ( 素 任 编辑 ) 
C 6 9. OK 






这 是 一 本 真正 从 “人 ” ( 而 非 技术 也 非 管 理 ) 的 角度 关注 软件 开发 人 员 自 身 发 展 的 书 。 书 中 论述 的 
包括 上 人 ”的 因素 ， 全 面 讲解 软件 行业 从 业 人 员 所 


程 到 精 耕 细 人 份 杀手 级 简历 ， 从 创 
就 到 与 如 何 与 “拖延 症 ” 做 斗争 ,甚至 





电 了 版。¥35.00 下 载 PDF 样 齐 


电 了 版 + 纸 质 版 半 59.00 














者 还 有 机 会 参与 书稿 的 审 校 和 翻译 工作 。 
号 人 











社区 提供 基于 Markdown 的 写作 环境 ， 





Wit 


欢 写作 的 您 可 以 在 此 一 试 身手 ， 在 社区 里 分 享 您 的 技术 心得 


和 读书 体会 ， 更 可 以 体验 自 出 版 的 乐趣 ， 轻 松 实现 出 版 的 梦想 。 
如 果 成 为 社区 认证 作 译 者 ， 还 可 以 享受 异步 社区 提供 的 作者 专 享 特色 服务 。 




















会 议 活动 早 知道 

















您 可 以 掌握 IT 圈 的 技术 会 议 资 讯 ， 更 有 机 会 免费 获 赠 大 会 门票 。 


加 入 异步 











异步 社区 ”” 微 信 服务 号 。 


社区 网 址 : www.epubit.com.cn 
官方 微 信 : 异步 社区 





扫描 任意 二 维 码 都 能 找到 我 们 : 

















微 信 订阅 号 ”官方 微 博 “QQ 群 : 368449889 


言 万 微 博 : @ 人 邮 和 异步 社区 ，@ 人 民 邮 电 出 版 社 - 信息 技术 分 社 





投稿 & 咨询 : contact@epubit.com.cn 





Python 面 向 对 象 
编程 指南 


本 书 通 过 实际 的 例子 对 Python 中 面向 对 象 编程 的 理念 进行 
介绍 。 针 对 所 有 可 用 于 和 Python 内 置 功能 进行 无 颖 结合 的 特殊 
方法 ， 本 书 都 提供 了 详细 示例 ， 并 且 介 绍 了 如 何 使 用 JSON、 
YAML、Pickle、CSV、XML、Shelve 和 SQL 来 创建 持久 化 对 
象 以 及 在 进程 间 传 输 对 象 。 本 书 还 介绍 了 Logging 和 Warning 模 
块 、 单 元 测试 、 配 置 文件 以 及 如 何 使 用 命令 行 。 

本 书 主要 分 为 3 个 部 分 : 用 特殊 方法 实现 Python 风格 的 类 ; 
持久 化 和 序列 化 ; 测试 、 调 试 、 部 署 和 维护 。 特 殊 方法 部 分 又 分 
为 : 初始 化 方法 、 基 本 特殊 方法 、 属 性 访问 、 可 调用 对 象 、 上 下 
文 、 容 器 、 人 集合、 数值 ， 以 及 装饰 器 和 mixin 类 等 高 级 技术 。 





本 书 适合 那些 对 Python 面向 对 象 的 基础 知识 有 一 定 掌握 的 
读者 。 对 于 想 要 写 出 有 一 定 复杂 度 且 能 与 Python 无 缝 结合 的 代码 
的 读者 ， 本 书 也 是 其 不 二 之 选 。 如 果 读 者 具备 计算 机 科学 的 专业 
背景 或 者 对 常见 的 设计 模式 有 一 定 的 使 用 经 验 ， 将 更 加 有 助 于 对 
本 书 内 容 的 学 习 。 


吕 周 步 什 区 
人 民 邮 电 出 版 社 


Www,epubit,com.cn 回 
注册 有 礼 ， 提 交 勘 误 送 积 
新 书 抢 鲜 ， 电 子 书 同步 发 售 


投稿 /反馈 邮箱 contact@epubit.com.cn 
新 浪 微 博 @ 人 邮 异 步 社区 








ISBN 978-7-115-40558-6 
和 





